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1 Einleitung 



Nach dem zu Beginn der Ära des World Wide Web von Hand gepflegte Linklisten und 
-Verzeichnisse und an Freunde und Kollegen per E-Mail verschickte Links genügten, um die 
Informationen zu finden, nach denen man suchte, waren schon bald Volltextsuchmaschinen 
und halbautomatisch betriebene Kataloge notwendig, um den mehr und mehr anschwellen- 
den Informationsfluten des Web Herr zu werden. 

Heute bereits sind diese Dämme gebrochen und viele Millionen Websites halten Billionen 
an Einzelseiten mit Informationen vor, von Datenbanken und anderweitig versteckten Infor- 
mationen ganz zu schweigen. Mit Volltextsuchmaschinen erreicht man bei dieser Masse kei- 
ne befriedigenden Ergebnisse mehr. Entweder man erzeugt lange Suchterme mit vielen Aus- 
schließungen und ebenso vielen nicht-exklusiven ODER- Verknüpfungen um verschiedene 
Schreibweisen für den gleichen Term abzudecken oder man wählt von vornherein die Daten- 
Quelle, an die man seine Fragen stellt, genau aus. Doch oft bleiben nur klassische Web-Such- 
maschinen übrig, zumal wenn der Fragende kein Informationsspezialist mit Kenntnissen von 
Spezialdatenbanken ist, sondern, von dieser Warte aus gesehenen, ein Laie. 

Und nicht nur im Web selbst, auch in unternehmensinternen Intranets steht man vor die- 
sem Problem. Tausende von indizierten Dokumente mögen ein Eckdatum sein, nach dem 
sich der Erfolg der Einführung eines Intranets bemessen lässt, aber eine Aussage über die 
Nützlichkeit ist damit nicht getroffen. Und die bleibt meist hinter den Erwartungen zurück, 
vor allem bei denen Mitarbeitern, die tatsächlich mit dem Intranet arbeiten müssen. 

Entscheidend ist für die Informationsauffindung in Inter- und Intranet eine einfach zu 
nutzende und leicht anpassbare Möglichkeit, neue interessante Inhalte zu entdecken. 

Mit Tags steht eine mögliche Lösung bereit. 
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a Taggingsysteme 

i Grundsätzliches 

Ein auf Tags basierendes Informationssystem gibt den Nutzern die Möglichkeit, eigene 
oder fremde Dokumente im System bekannt zu machen und mit einem oder mehreren Tags 
zu versehen. Je nach System müssen die Nutzer dabei keine oder nur wenige formale Daten 
erschließen, wobei es auch Systeme gibt, die dies verlangen. Die Eingabe der zwingend benö- 
tigten Daten soll für die Nutzer so einfach wie möglich gestaltet sein. Je nach Ausrichtung 
des Systems (siehe Kapitel Ausprägungen von Taggingsystemen, S. 30ff) erlaubt das System 
den Nutzern, eigene Sammlungen (auch „Bibliotheken", „Listen'' genannt) anzulegen und in 
ihnen nach vergebenen Tags zu navigieren bzw. zu filtern. Solche Systeme werden zur Ver- 
waltung von Bookmarks (Favoriten) oder Bildern benutzt, zur Pflege von Literaturlisten und 
Bibliographien, oder zum Auffinden und Bewerten von Nachrichten, Restaurants und ähnli- 
chem. 

ii del.icio.us 

del.icio.us, 2003 von Josua Schachter gegründet^ ist eine Bookmark- Verwaltung. Anders 
als die aus Web-Browsern bekannten Ansätze speichert del.icio.us die gesammelten Verwei- 
se nicht auf einem Personal Computer, sondern zentralisiert auf der del.icio.us-Website^. So- 
mit haben die Nutzer von jedem Internetzugang aus Zugriff auf ihre Bookmarks. 

Bookmark- Verwaltungen in Web-Browsern orientieren sich in ihrer Struktur an Dateiver- 
waltungssystemen mit Verzeichnissen (Ordern), und damit an einem hierarchischen Ansatz. 
Unterhalb des „Hauptverzeichnisses'' kann der Nutzer Verweise auf Webseiten (Bookmarks) 
anlegen, Unterverzeichnisse erstellen und so eine Hierarchie erzeugen, in der er seine Book- 
marks ablegen kann. 



1 Siehe http://del.icio.us/about/info - Zugegriffen am 19.06.2006. 

2 Siehe http://del.icio.us/ 
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Nachteilig dabei ist zum einen, dass eine solche Bookmark-Sammlung nur auf dem eige- 
nen Personal Computer benutzbar ist, zum anderen dass sie nur mit dem gleichen Browser 
benutzt werden kann, mit dem sie erstellt wurde. 

Auch die hierarchische Gliederung bringt Nachteile mit sich. So kann ein Bookmark im- 
mer nur einer Klasse (Ordner) zugeordnet werden, nicht aber mehreren (es sei denn, der Be- 
nutzer kopiert ihn in jeden Ordner, in dem er erscheinen soll). 



Root 



il 



Felder a 



Felder b 



Felder c 



Felder b1 Felder b2 Felder c1 Felder c2 



URL 



^' 



Abbildung 1-1: Schematische Darstellung der hierarchischen Struktur von Book- 
mark-Sammlungen in Webbrowsern Die Ressource „ URL x " ist in Ordner c2 abge- 
legt. 



Abgesehen davon bieten die Bookmark- Verwaltungen der Web-Browser nur sehr rudi- 
mentäre Möglichkeiten der Suche und Verwaltung. Zumeist beschränken sich die Möglich- 
keiten auf das Anlegen, Verändern und Löschen von Bookmarks und Ordnern. 



del.icio.us bietet weitaus mehr. Als Werkzeug für Schachters persönliche Bookmark- 
Sammlung geschrieben (genannt „muxway'', vgl. [Norton2006]), ermöglicht del.icio.us die 
Ablage von Bookmarks unter beliebigen und beliebig vielen Schlagworten: Tags. 
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Processing Large XML Documents with PHP 5 edit/ 

delete 

To sum up: XMLReader is a powerfull ejttension to parse large XML 

documents, it's usually much fasterthan SAX (Iwice as fast), while still 

scaling without probiems on the memory side. With the expandO 

method, it's now also possible to mix the features of 

to xml php taenchmark Performance ... saved tay 6 other people ... on 

july 17 

Abbildung 1-2: Ein einzelner Bookmark in del.icio.us, wie ihn ein Nutzer in seiner 
eigenen Bookmarks-Sammlung sieht. Zu sehen ist der Titel der verlinkten Webseite, 
ein Zitat aus der Seite, die benutzten Tags, die Anzahl der übrigen Nutzer, die diese 
Webseite ebenfalls gebookmarkt haben sowie das Datum, an dem die Webseite 
gebookmarkt wurde. 



Abbildung 1-2 zeigt einen Bookmark aus der Bookmark-Sammlung eines del.icio.us-Nut- 
zers. Dieser Bookmark wurde mit den Tags „xml", „php", „benchmark" und „Performance" 
getaggt. Sobald ein Nutzer ein Tag vergibt, erzeugt er damit einen Pseudo-Ordner (auch 
„bücket" genannt). Der in Abbildung 1-2 gezeigte Bookmark ist in den Pseudo-Ordnern 
„xml", „php", „benchmark" und „Performance" abgelegt. 



I 



Tag a, 




Tagd 



URLx 



Abbildung 1-3: In Bookmark- Verwaltungen wie del.icio.us, die auf Tags basie- 
ren, kann ein Bookmark zu mehreren Tags - "Ordnern" — gehören. Die Res- 
source „ URL X " ist in den „ Ordnern " Tag a, Tab b und Tag g abgelegt. 



Auch die Suche bzw. das Browsen in der Bookmark-Sammlung wird von del.icio.us stark 
vereinfacht. Im Kapitel Taggingsysteme am Beispiel von del.icio.us, S. 63ff, wird dies deut- 
lich. 
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iii Flickr 

Mit der Online-Bildverwaltung Flickr^ steht ein Dienst bereit, mit dem Fotografien, Bilder 
und Illustrationen jeder Art online verwaltet werden können. Wie del.icio.us ermöglicht 
Flickr dabei die Eingabe von Tags zur Indexierung der Ressource. Im Gegensatz zu del.i- 
cio.us, wo jede Ressource in den Bookmark-Sammlungen mehrerer Nutzer auftauchen und 
daher von mehreren Menschen getaggt werden kann, erlaubt Flickr nur demjenigen Nutzer, 
der eine Ressource erstellt, sie zu taggen. In der Literatur wird hierbei nach „set-model'' und 
„bag-model" unterschieden (siehe Aggregation, Seite 35). 

iv CiteULike 

Wo del.icio.us eine Anwendung zur Sammlung generischer Bookmarks - oder besser: per 
HTTP erreichbarer Ressourcen - ist, sieht sich CiteULike als Dienst für wissenschaftlich ar- 
beitende Menschen und fokussiert daher auf wissenschaftliche Ressourcen wie Zeitschriften- 
aufsätze, Proceedings usw. Dazu stellt^ es eigens entwickelte Schnittstellen zu Systemen wie 
ACM Digital Library^, CiteSeer^ oder IEEE Xplorer^ bereit, mit denen die Übernahme biblio- 
graphischer Daten weitgehend automatisiert wird. Darüber hinaus ist auch CiteULike tag- 
basiert und ermöglicht neben der Suche nach Autoren und Titel die Filterung nach Tags. Als 
vor allem für wissenschaftlich arbeitende Menschen erstelltes Werkzeug bietet CiteULike die 
Möglichkeit der Eingabe bibliographischer Daten im Rahmen einer Formalerschließung. Dar- 
über hinaus gibt es Im- und Exporter für BibTex und EndNote, Formate zur Speicherung bi- 
bliographischer Daten für Literatur Verwaltungssoftware. 

Im Kapitel Kollaborativer Ansatz, S. 38ff, beschreibe ich ein System, das anhand CiteULi- 
ke zeigt, wie Tagging bzw. Folksonomies für Collaborative Filtering eingesetzt werden kön- 
nen. 



3 Siehe http://www.flickr.com/ - Zugegriffen am 19.07.2006. 

4 Siehe http://www.citeulike.org/faq/all.adp - Zugegriffen am 19.07.2006. 

5 Siehe http://portal.acm.org/dl.cfm - Zugegriffen am 19.07.2006. 

6 Siehe http://citeseer.ist.psu.edu/ - Zugegriffen am 19.07.2006. 

7 Siehe http://ieeexplore.ieee.org/ - Zugegriffen am 19.07.2006. 
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V Weitere Systeme 

Hammond et al. (vgl. [Hammond2005]) betrachten in ihrer Übersicht über bestehende 
Taggingsysteme neun Systeme: die bereits erwähnten del.icio.us, CiteULike und Flickr, und 
darüber hinaus Connotea, Prassle, Furl, Simpy, Spurl.net sowie unalog. Weiterhin erwäh- 
nenswert sind zum Beispiel steve.museum und Qype, mit denen im Gegensatz zu den vorge- 
nannten Ausstellungsstücke in Museen sowie Örtlichkeiten getaggt werden können. 

steve.museum 

Getragen von mehreren namhaften nordamerikanischen Museen, zum Beispiel dem Gug- 
genheim Museum oder dem The Metropolitan Museum of Art, ist es das Ziel dieser Initiati- 
ve^ Museumsbesuchern die Möglichkeit zu geben, Ausstellungsstücke mit Tags zu beschrei- 
ben. Die Beweggründe lauten^: 



People see different things. What a specialist notices may not he important 
to a member of the Qeneral public, and vice versa, and the words that a 



to a member of the general public, and vice versa, and the words that a 
curator uses may not be familiär to the average museum-goer. Allowing 
users [to] describe collections — using their own vernacular or language — 
may help other users find things that interest them. 



Man sieht die Vorteile unter anderem in einer engeren Verbindung zwischen Museums- 
besuchern und den Museen^°: 



User-based description also allows people to develop a more personal 
relationship to museums and museum collections. They can contribute their 
knowledge, and see the improvements that result from sharing their exper- 



8 Siehe http ://www. steve.museum/ - Zugegriffen am 24.06.2006. 

9 Siehe http://www.steve.museum/index.php?option=com_content&task=view&id=38&Itemid=61 - Zugegriffen am 
24.06.2006. 

10 Siehe http://www.steve.museum/index.php?option=com_content&task=view&id=42&Itemid=61 - Zugegriffen am 
24.06.2006. 
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In einer Veröffentlichung vom März 2006 (vgl.. [Chun2006]) heißt es weiter: 



Museums have an opportunity to enhance user experience and to experi- 
ment with new strategies for user engagement that builds Community and 
attract new audiences. 



Mit der Hilfe von Freiwilligen sollen ab September 2006 Objekte aus den Sammlungen der 
teilnehmenden Museen getaggt werden. Dazu werden Web-Kataloge mit Fotografien der 
Objekte bereitgestellt. Die teilnehmenden Freiwilligen können dann in diesen Kataloge 
browsen und die Objekte taggen. 



Powerhouse Museum CoUection 

Das Powerhouse Museum in Sydney ist nach eigenen 
Angaben das größte und populärste Museum Australiens 
und beherbergt 385.000 Objekte verschiedenster Art^\ Auch 
hier werden von Freiwilligen Objekte mit Tags indexiert. 
Der Ansatz des Powerhouse Museum verknüpft bei der Su- 
che auf der Website die Tags mit dem Thesaurus, nach dem 
die Objekte des Museums im Katalog erschlossen sind. 



Related user keywords 

■^ blü9 
+ bowl 
+ brass 
+ China 
+ flowers 
+ mteresting 
+ jug 

+ landscape 
+ yellow 

Search filter 

+ Bowls 

+ Ceramicforms 

+ Commemorative objects 

+ CoverecJ bowls 

+ Dishes 

+ Domras 

+ Flower bowls 

+ Jugs 

+ Liqueur glasses 

+ Saucers 

+ Sculptures 

+ Spoons 

+ Tea bowls 

+ Tea sets 

+ Teacups 

+ Teaspoons 

+ Vases 

Abbildung 1-4: Ausschnitt aus dem Sucher- 
gebnisfür "bowl" in der Sammlung des 
Powerhouse Museum. Oben die von Benut- 
zern eingegeben Tags, die mit "bowl" in 
Beziehung stehen, unten die Klassen aus dem 
Thesaurus des Museums. 



Qype 



Bei Qype handelt es sich um ein Tagging-System für Örtlichkeiten wie Bars und Restau- 
rants, aber auch für Geschäfte, Handwerker und jede Art von lokaler Dienstleistung. Die Be- 



1 1 Siehe http://www.powerhousemuseum.com/about/in.dex.asp - Zugegriffen am 06.08.2006. 
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nutzer können, nach Städten geordnet, Informationen zu den diversen Dienstleistungen ab- 
rufen , sie rezensieren und ihnen Tags und Bewertungen zuweisen. Die Suche von Qype ba- 
siert hauptsächlich auf den Tags, wobei aber auch nach formalen Angaben wie Firmennamen 
und ähnlichem gesucht werden kann. Die Implementierung erinnert an das Recommendati- 
on-System von Amazon.com, das in der US-amerikanischen Version seit einiger Zeit eben- 
falls Tagging unterstützt^^. 



überall | Hamburg | Berlin | Köln | München | mehr Städte.. 

QXP^DARMSTADT 



Feedback | Blog | Hijfe | Abmelden 



was? Mode, Werkstatt, Bio) wo? 

[bücher | [Parmstadt 



Suchergebnisse bücher Darmstadt 



-idef leer) 



fait 15000 rage gesamt 
Gewinnspiel 



IJJJII.I.IJJIilU.IJil 



Verwandte Tags: 

Ausleihen bestseller Bücher Lesen Mängelexemplare Marktplatz Restposten schmökern Zeitvertreib 

##### lSeit>:a^ 
tsgs: bücher nnarktplat: 



Büchergilde Buchhandlung am Markt 

Marktplatz 10, 64283 Darmstadt 



B 



Calvin Eine kleine, aber feine Buchhandlung am Marktplatz. Gut sortiert. 
Freundliche und kompetente Bedienung, 



' mehr... I^^eitrag schreibenll merken | 

tags: ausleihen bücher Zeitvertreib 

Stadtbibliothek Darmstadt 

® Website 

Große Bachgasse 2, 64283 Darmstadt 

Calvin Wundervolle Bibliothek, angenehme Atmosphäre, sehr gut sortief^f^gpuj, 
auch in DVDs und Hörbüchern, Praktisch ist auch der Extra-Service, Mai 
zahlt 2,60 € Service,,, 



IE] 

1 © 

l J^liUll 

dUnslao 



Jice-Hospilär] 
Roter Kred 

sehe L^ 



■ä 






■ele/ji|la^ -^ Niitz.unasbe.dipigür\^i 



mehr... I Beitrag schreiben I merken 



Google-Anzeiaen 



Abbildung 1-5: Suchergebnis von Qype für "bücher" in Darmstadt. Es zeigt neben 
den Treffern links auf der rechten Seite eine Karte mit den Standorten der Treffer. 
Außerdem werden zu "bücher" verwandte Tags angezeigt. 



12 Siehe http://www.amazon.com/gp/product/0596007655/ - Auf dieser Produktseite sind neben Rezensionen und 
Bewertungen auch die Tags zu sehen, mit denen Amazon-Kunden das Buch „Ambient Findabiüty" getaggt haben. 
Zugegriffen am 08.08.2006. 
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2 Tags - freie Schlagwörter vergeben durch Nutzende 

Im Folgenden wird anhand von Beispielen gezeigt, welche Arten von Tags es gibt und 
welche Probleme durch die freie Verschlagwortung mit Tags entstehen. Es wird beschrieben, 
aus welchen Motivationen heraus Nutzer Tags vergeben. Weiter wird gezeigt, anhand wel- 
cher Kriterien man Taggingsysteme vergleichen kann. Dann werden Verbesserungsvorschlä- 
ge gemacht, wie der Taggingprozess selbst verbessert werden könnte, um die beschriebenen 
Probleme teilweise zu lösen. Den Schluss dieses Kapitels bildet die Erläuterung eines Colla- 
borative Filtering-Systems anhand von CiteULike. 

a Definition 

Der Begriff tag stammt aus der englischen Sprache und meint eine Markierung in Form 
eines Stück Papiers oder Pappe, dass an einem Gegenstand angebracht wird, um diesen zu 
markieren (vgl. Dicl983]): 



a small narrow piece of paper, material, etc., flxed to something to 
show what it is, who owns it, details about it, etc. 



Diese Definition aus einem einsprachigen Wörterbuch zeigt bereits, dass ein Tag benutzt 
wird, um Informationen über einen Gegenstand, also Metadaten, aufzunehmen bzw. zu 
transportieren. Weiterhin lässt diese Definition offen, wie viele Tags einem Gegenstand zu- 
geordnet werden und von wem. Es ist also ohne weiteres möglich, einem Gegenstand mehre- 
re Tags zuzuordnen, und es ist auch möglich, dass mehrere Personen dies unabhängig von 
einander tun. Auch legt die Definition nicht fest, welcher Art die Informationen, die einem 
Gegenstand so zugeordnet werden, sein sollten. Fest steht, dass es Informationen sind, die 
den Gegenstand näher betrachten und ihn - zumindest teilweise - beschreiben. 

Tags können Aufschluss geben über verschiedene Facetten bzw. Eigenschaften eines Ge- 
genstands. Golder und Huberman (vgl. [Golder2005]) nennen sieben Arten von Tags: 
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1. Identifying what (or who) it is about 

2. Identifying what it is 

3. Identifying who owns it 

4. Refining categories 

5. Identifying qualities or characteristics 

6. Seif reference 

7. Task organizing 

Zum dritten Punkt, who owns it, lässt sich hinzufügen who created it. So zumindest meinen 
Golder und Huberman diesen Punkt, wenn sie von content ownership sprechen. 

An dieser Einteilung wird klar, dass Tags mehr sind als freie Schlagworte oder Deskripto- 
ren, die sich ausschließlich auf den Inhalt und das Themengebiet des Inhalts eines Gegen- 
stands beziehen, dass Tags nicht aus einem kontrollierten Vokabular stammen, und somit 
auch keine Schlagworte im klassischen Sinn sein können, erschließt sich aus der Bandbreite 
der möglichen Arten. Sie sind auch mehr als Stichwörter, die aus formalen Angaben zu ei- 
nem Gegenstand gewonnen werden. 

Dazu kommt, dass Tags im Gegensatz zu Schlag- und Stichwörtern weder in automati- 
schen Verfahren noch von geschulten Informationsspezialisten vergeben werden, sondern 
von den Endnutzern der Datensammlungen selbst. 

In dieser Arbeit meint der bis hierher gebrauchte Begriff Gegenstand natürlich Dokumenta- 
rische Beschreibungseinheit (DBE). Diese Dokumente sind, wenn von Tags die Rede ist, direkt 
per HTTP adressierbare Dokumente wie Webseiten, Bilder und andere Mediendateien. An- 
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stelle von Gegenstand oder Dokument wird in dieser Arbeit auch von Ressourcen gespro- 
chen. 



Kommen wir nun noch einmal zu den Klassen von Tags nach Golder und Huberman zu- 
rück. 

i Identifying what (or who) it is about 

Solche Tags nehmen direkten Bezug auf die in dem Dokument diskutierten Themengebiete 
oder Personen und Organisationen. Diese Arbeit könnte beispielsweise mit den folgenden 
Tags versehen werden: „tags'\ fMgging'\ „anwenäungen'', „jolksonomy'\ ,Mxonomien'\ „üher- 
sicW , „collaborative-filtering''. 

In den meisten Fällen sind diese Tags Nomen. 

Anhand dieser Tags wird der Inhalt dieser Arbeit beschrieben, ohne auf formale Aspekte wie 
Autor oder Dokumenttyp einzugehen . Zu diesen Eigenschaften kommen wir nun. 

ii Identifying what it is 

Ohne auf den Inhalt einzugehen, beschreiben Tags dieser Klasse, was für ein Dokument hier 
vorliegt. Für diese Arbeit wäre das passende Tag „diplomarbeit". 

Mit diesem Tag wird klar, dass es sich hier um eine Diplomarbeit handelt. 

iii Identifying who it owns 

Wie oben erläutert, nimmt man mit solchen Tags Bezug auf den Ersteller eines Dokuments. 
Dies kann eine Person oder eine Personengruppe sein oder eine Organisation. Beispiele: 
„sascha-carlin", „fbiuw". 
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iv Refining categories 

Mit diesen Tags, die für sich allein genommen keine genaue Aussagekraft besitzen, können 
einzelne Tags verfeinert werden, um detaillierter auf eine Facette des Dokuments einzuge- 
hen. Zum Beispiel könnte das Tag „diplomarbeif' mit dem Tag „zur erlangung des diploms 
im studiengang inf ormations- und Wissensmanagement" verfeinert werden, um diese spezi- 
elle Eigenschaft des Dokuments aufzuzeigen. Kürzere Tags wären sicherlich sinnvoller, zum 
Beispiel „fbiuw", „iuw" oder „informationswirt". 

V Identifying qualities or characteristics 

Tags dieser Klasse beschreiben den Dokumentinhalt durch passende Adjektive. Je nach Do- 
kument macht es mehr oder weniger Sinn, solche Tags zu benutzen. Beispiele: „witzig", 
„lang", „informativ", „lesenswert", „schlecht", „gut". 

vi Seif reference 

Dies sind Tags, die der Nutzer verwendet, um seine Beziehung zu dem Dokument oder dem 
Inhalt darzustellen. Kunstwörter, bestehend aus Possessivpronomen und Angaben zum Typ 
des Dokuments werden hier benutzt, zum Beispiel „meinearbeiten" oder „meinemeinung". 

vii Task organizing 

Damit gemeint sind Tags, die der Tagger benutzt, um Aufgaben mit einem Dokument zu 
verknüpfen, wie „lesen" oder „ausdrucken". In der englischen Sprache sind Tags wie „to- 
read" (lies: to read) möglich. 

Es ist erkennbar, das lediglich die ersten drei bis vier Klassen von Tags unabhängig vom 
Nutzer sein können. Mit den Tags der letzten zwei bis drei Klassen kann niemand außer 
demjenigen Nutzer, der sie eingab, für sich selbst etwas anfangen; sie sind intrinsisch in Re- 
lation zu der Person, die sie eingab, wohingegen die ersten drei Klassen extrinsisch sind. 
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b Probleme 

Da jedes Wort jeder natürlichen Sprache - sowie Abkürzungen, Produktnamen und so 
weiter - zu einem Tag werden kann, entstehen ähnliche Probleme, die auch natürliche Spra- 
chen haben, zum Beispiel in den Bereichen der Rechtschreibung (Syntax) und der Disambi- 
guierung (Semantik). Da die meisten Taggingsysteme über das World Wide Web weltweit 
zur Verfügung stehen, entstehen natürlich auch Sprachbarrieren - wiederum in Syntax und 
Semantik. Letztlich werden die Problemfelder Benutzung von Sonderzeichen und Subjektivi- 
tät von Informationen vorgestellt. 

i Homonyme und Synonyme 

Was ist mit dem Begriff „Dose" gemeint? Eine Schachtel oder Box aus Blech, deren Deckel 
sich vollständig vom Unterteil lösen lässt - oder ein Personal Computer, auf dem ein Micro- 
soft DOS-Betriebssystem läuft? Rein grammatikalisch lässt sich auch nicht sagen, ob mit 
„Froschgift'' ein Gift gegen Frösche (wie in „Rattengift") gemeint ist oder die Umkehrung, 
Gift, das von Fröschen gewonnen wird. 

Nutzen wir einen Tag wie „dose", um - zugegebenermaßen satirische oder zumindest 
lustige - Informationen über Windows-PCs zu finden, müssten wir dem initialen Suchbegriff 
weitere hinzufügen, um disambiguieren zu können, weil uns im Moment keine andere Art 
Dose interessiert. 

ii Sprachbarrieren 

Die beiden Tags „deutsch" und „german" sind gleichbedeutend, wenn auch das eine Tag 
in deutscher Sprache und das zweite in der englischen geschrieben wurde. Ähnliches kann 
für „mops'' und „carlin" gesagt werden, oder für „gazetta" und „zeitung". 
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Guy und Tonkin (vgl. [Guy2006]) untersuchten ca. 3000 Tags aus del.icio.us und Flickr. 
Sie prüften unter anderem die Sprache der einzelnen Tags mit aspelf^, einem Unix-Werkzeug 
zur Rechtschreibprüfung und textbasierter Spracherkennung. 



Hickrtag languages 



delJcio ustag languages 
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Abbildung 2-1: Erkannte Sprachen aus 3000 Tags von Flickr und del.icio.us 

Wie in Abbildung 2-1 zu sehen ist, ist englisch mit Abstand die am häufigsten erkannte 
Sprache: 45% der Flickr-Tags und 65% der del.icio.us-Tags identifiziert aspell als englisch 
(American English oder British English werden zusammengefasst betrachtet, auch wenn es 
teils erhebliche Unterschiede in der Schreibweise vieler Wörter gibt. Wo es in British English 
beispielsweise „colour" und „aluminium" heißt, wäre in American English „color" und „alu- 
minum" korrekt ^^. Die zweit häufigste Sprache ist Spanisch, die jedoch in beiden Systemen 
mit unter 2% kaum ins Gewicht fällt. Es folgen Französisch bzw. Deutsch und Portugiesisch, 
wobei das Vorkommen dieser Sprachen verschwindend klein ist. 

Natürlich lässt sich daraus nicht schließen, dass es keine Sprachbarriere gäbe. Aus unse- 
rem deutschsprachigen Kontext heraus haben wir eine andere Sicht auf dieses Problem und 
empfinden es eher als störend als es Menschen in einem englischsprachigen Land tun wür- 
den. Guy und Tonkin bemerken dazu: 



combined are valid English language dictionary words using US or Bri- 
tish spelling, tags from other countries are represented and may he in 
various foreign languages. 



13 Siehe http://aspell.sourceforge.net/man-html/Supported.html. Zugegriffen am 04.07.2006. 

14 Siehe http://miless.uni-duisburg-essen.de/servlets/DocumentServlet?id=l 1636. Zugegriffen am 10.07.2006. 
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Sie nennen ein weiteres Beispiel, für das Problem der Sprachbarriere. Manche Worte kom- 
men, in gleicher Schreibweise, in verschiedenen Sprachen vor. So ist „son" nicht nur das eng- 
lische Wort für „Sohn", sondern auch ein adjektivisches Possessivpronomen in der französi- 
schen Sprache. Das im italienischen für Butter stehende Wort „burro" meint auf spanisch 
einen Esel. 

iii Rechtschreibfehler 

Guy und Tonkin haben bei einer automatischen Überprüfung von insgesamt ca. 3000 Tags 
aus del.icio.us und Flickr herausgefunden, dass 40% der Flickr-Tags und 28% der del.icio.us- 
Tags Rechtschreibfehler enthielten, in einer Sprache, die nicht durch die von ihnen benutzte 
Software unterstützt wurde, geschrieben wurden oder aus mittels Symbolen zusammenge- 
setzten Wörtern bestanden. 

Ein Teil dieser „Rechtschreibfehler" wird nach ihrer Beobachtung durch fehlerhaftes oder 
ungenügendes Character Encoding verursacht. Gerade bei Sprachen, deren Zeichensatz über 
den der lateinischen Zeichen hinausgeht, kommt es nach Darstellung von Guy und Tonkin 
zu Problemen. Angeführt werden zum Beispiel die deutsche Sprache mit ihren Umlauten, 
aber auch chinesisch, japanisch, russisch und tschechisch. Dieser Teil des Problems ließe sich 
durch eine konsequentere Nutzung von Unicode - einem Zeichensatz, der die Zeichen (fast) 
jeder lebenden Sprache abbildet - beheben oder zumindest besser beherrschbar machen. 

Leider ist die Untersuchung an dieser Stelle ungenau. Aus den vorliegenden Zahlen und 
mittels der genutzten Methode lässt sich keine exakte Aussage über Rechtschreibfehler ma- 
chen. Immerhin unterstützt aspell aber eine Vielzahl an Sprachen, so dass der Anteil der des- 
wegen nicht erkannten Worte relativ klein sein dürfte. Guy und Tonkin untersuchten außer- 
dem die zusammengesetzten Begriffe und nennen für diese - in den Daten von del.icio.us - 
einen relativen Anteil von 10%. Damit sinkt der Anteil der vermeintlichen Rechtschreibfehler 
auf 18% für die del.icio.us-Daten. 
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Ein Teil der als fehlerhaft erkannten Tags bei Flickr könnten sogenannte Geotags sein. 
Geotagging^^ gibt, mittels besonders kodierter Angaben zu Längen- und Breitengrad (bspw. 
„geo:lat=47.559967'' und „geo:lon=7.591526") den exakten Ort, an dem eine Fotografie ge- 
macht wurde, wieder. Desweiteren werden Fotografien bei Flickr oft mit Angaben zur Kame- 
ra^^ zum Beispiel der Modellnummer („d50" [140.369], „20d'' [106.784]) und -bezeichnung 
(„eos" [102.777], „coolpix" [25.001], ..) und Herstellernamen („canon" [502.507], 
„kodak" [90.165], „nikon" [337.472], ...) getaggt. 

Der im Vergleich zu del.icio.us wesentlich höhere Anteil an nicht erkannten Tags (40% ge- 
genüber 28%) könnte also auch aus diesen quasi nicht erkennbaren Tags herrühren. 

iv Sonderzeichen in Tags 

Ein weiteres von Guy und Tonkin erwähntes Problem sind Symbole wie # oder @, die be- 
nutzt werden, um einzelne Tags in der alphabetischen Liste direkt zu Beginn auftauchen zu 
lassen. Auch solche Tags sind in die Summe der nicht erkannten Tags einzurechnen. Bei- 
spielhaft seien hier drei Linksammlungen erwähnt, die der del.icio.us-Nutzer 
„brownorama''^^, „jamesmelzer"^^ und „erikhaugo"^^. Beide nutzen bestimmte Sonderzeichen 
zur Markierung von Themen, Objektarten, Autoren, Quellen und Aktivitäten, die sie mit den 
Ressourcen ihrer Sammlung verbinden. Beide bewerten die Ressourcen auch durch Sonder- 
zeichen, nämlich Sternen (*^). In Anlehnung an die Tag-Typen nach Golder und Hubermann 
(siehe Seite 17ff) hier eine vergleichende Übersicht über Tag-Typen und wie sie mit Sonder- 
zeichen markiert werden. 



15 Siehe http://en.wikipedia.org/w/index.php?title=GeoTagging&oldid=62847755. Zugegriffen am 12.06.2006. 

16 Siehe http://flagrantdisregard.com/flickr/topcameras.php - Die Angaben in eckigen Klammern entspricht der 
Anzahl der mit den jeweiligen Tags getaggten Bildern bei Flickr am 13.07.2006. 

17 Siehe http://del.icio.us/brownorama/ - Zugegriffen am 13.07.2006. 

18 Siehe http://del.icio.us/jamesmelzer - Zugegriffen am 13.07.2006. 

19 Siehe http://del.icio.us/erikhaugo - Zugegriffen am 13.07.2006. 
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Identifying what it is 



Tags die Angaben zum Typ einer Ressource 
machen, wird das Gleichheitszeichen 
vorangestellt: „=excel" oder „=review". 



Identifying who it owns 



Identifying qualities or characteristics 



Angabe der Quelle mit „in: Quelle" oder 
„@Quelle". Parallel dazu werden die Stellen, 
von denen aus man auf die Quelle stieß, mit 
„via:Hinweisequelle" getaggt. 

Bewertung des Inhalts mit Sternen nach einem 
Punkteschema; je mehr Sterne (bis zu fünf 
werden i. d. R. vergeben), desto besser oder 
interessanter ist die Ressource. Zum Beispiel 
„*'^*'^'^" für eine sehr gute oder interessante 
Ressource. 

Adjektiven wird ein Tilde vorangestellt, zum 
Beispiel „-funny" oder „-cool". 



Task organizing 



Solchen Tags wird ein Ausrufezeichen 
vorangestellt, zum Beispiel „Itoread" oder „! 
tobuy". 



Tabelle 1: Nutzung von Sonder zeichen zur Markierung bestimmter Tag-Typen. 



V Zusamraengesetzte Begriffe 

Guy und Tonkin identifizieren ein weiteres Problem als das größte mit einem Vorkom- 
men von über 10% von allen untersuchten del.icio.us-Tags. del.icio.us Benutzer verwenden 
oft zusammengesetzte Worte als Tags. Diese werden aber, aufgrund einer fehlenden Kon- 
vention, mit verschieden Trennzeichen geschrieben. 



Zumeist wird zwar der einfache Bindestrich genutzt, andere Zeichen tauchen aber ebenso 
in signifikantem Anteil auf. Dem Schrägstrich (Slash) kommt überdies eine weitere Bedeu- 
tung zu. Er wird benutzt, um einen (nach Guy und Tonkin) „pathway'' darzustellen. 
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del.icio.us Compound Separators 




7 devel/ajax 

1 devel/appleScript 

4 devel/c 

4 devel/c++ 

1 devel/css 

2 devel/cvs 
1 devel/db 

1 devel/docs 

2 devel/dotnet 
1 devel/flash 

1 devel/gmail 

6 devel/java 

18 devel/java Script 
Abbildung 2-3: Der Slash als 
Trennzeichen bei del.icio.us. 



Abbildung 2-2: Relativer Anteil verschiedener Trennzeichen bei zusammen 
gesetzten Wörtern 



Beispielsweise „devel/c++'', „devel/php" oder „devel/java''. Auch wenn del.icio.us diese 
„pathways'' nicht als solche abbildet - das heißt, del.icio.us kennt das Konzept einer Baum- 
struktur oder Hierarchie nicht; Tags werden schlicht alphabetisch geordnet - erscheinen sie 
in der alphabetischen Liste der eigenen Tags geordnet in einer „Baumstruktur": 



Diese „Baumstruktur'' lässt auch 



1 GM/Fehler 

1 GM/Fehler/test 

1 GM/Home ^ ^ 

Abbildung 2-4: Mehrere Ebenen einer Pseudo-Baumstruktur mit- mehrere Ebenen ZU. del.icio.US ermög- 
tels dem Slash als Trennzeichen. 

licht es aber nicht, da es keine Hierar- 
chie kennt, diese „pathways" zu trennen. Eine Navigation von „GM" zu „Fehler" zu „test" 
ist nicht möglich - für das System ist „GM/Fehler/test" ein Tag. 



Neben der Benutzung von Trennzeichen zur Zusammenführung mehrerer Begriffe zu ei- 
nem Tag wird auch der von den Wikis entliehene Ansatz des CamelCase^° benutzt. Wikis 
sind sehr einfache Web Content Management Systeme, die in der Grundform jedem die Ver- 
änderung des Inhalts einer Seite erlauben. Wikis nutzen CamelCase zur Beschreibung von 
Seitennamen. Erkennt die Wiki Engine^^ einen Ausdruck in CamelCase, verlinkt es automa- 



20 Siehe http://c2.com/cgi/wiki7CamelCase - Der Ausdruck CamelCase rührt aus der Praxis her, in Programmcode 
statt Unterstrichen gar keine Trennzeichen zu verwenden: READ WRITESTREAM wird zu ReadWriteStream. 
Zugegriffen am 11.07.2006. 

21 Siehe http://c2.com/cgi/wiki7WikiEngine - Eine Wiki Engine ist eine Software, die nach den Wiki-Prinzipien 
(http://c2.com/cgi/wiki7WikiPrinciples) funktioniert. Zugegriffen am 11.07.2006. 
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tisch auf diese Seite. Begriffe in CamelCase sind also sowohl Seitennamen bzw. -titel als auch 
Teil der URI der Seite. 

Zu den bereits erwähnten nicht erkennbaren Tags in Bezug auf Guys und Tonkins Unter- 
suchung zu „falschen" Tags müssen wir auch diejenigen Tags zählen, die in CamelCase ge- 
schrieben sind, es sei denn, der so zusammengesetzte Begriff löst sich zu einem Wort einer 
bekannten Sprache auf. 

vi Subjektivität der Information 

Informationen an sich sind nicht subjektiv, wohl aber der Informationsbedarf des Nut- 
zers. Es kann also durchaus vorkommen, dass mehrere Nutzer die selbe Ressource aus unter- 
schiedlichen Interessen oder Kenntnissen oder Aufgabenstellungen (vgl. [Fugmannl999]) 
heraus taggen. Aufgrund der unterschiedlichen Motivationen, Wissensstände und äußeren 
Umstände ist es sehr unwahrscheinlich, dass die Nutzer die exakt gleichen Tags wählen. 
Wahrscheinlich werden sie im Kern gleiche oder ähnliche Tags wählen, aber um diese Kern- 
Tags herum solche, die es ihnen selbst leichter machen, später den Inhalt wieder einzuschät- 
zen. 

Golder und Huberman weisen ebenfalls auf dieses Problem hin und beschreiben drei 
Klassen tatsächlich persönlicher Tags (Identifying qualities or characteristics. Seif reference, 
Task organizing [siehe Kapitel Identifying qualities or characteristics. Seif reference und Task 
organizing, S. 18ff]), die nur für denjenigen Benutzer Sinn ergeben, der sie selbst eingegeben 
hat. Im Sinne eines kollaborativen Ansatzes (siehe Kollaborativer Ansatz, S. 38ff) sind solche 
Tags nutzlos und unterstützen weder das Browsing noch die Suche. 

Mejias (siehe Kapitel Vorschläge zur Verbesserung des Tagging-Prozesses, S. 37f) (vgl. 
]V[ejias2005]) zitiert an dieser Stelle Kress (vgl. [Kress2003]): 



[...] words in combination are not much more than rough outlines wait- 
ingfor US the readers to colour them in. What the written text provides 
is words in clear order. Each word asks to be filled with meaning, a 
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3amng that comes from our past experience ofthat word in our social 



Damit gemeint ist, dass ein grammatikalisch und syntaktisch korrekter Satz dennoch von 
jedem Leser anderes interpretiert wird. Diese Interpretation basiert auf den Erfahrungen des 
Lesers und seinem Wissen. Ein gutes Beispiel dafür sind Gedichte oder ironische Bemerkun- 
gen. Mejias führt dazu weiter aus: 



While Kress is ref erring to written texts with a "clear order" (such as 
sentences and paragraphs), an unordered group of tags used to 
describe a resource holds the same potential to be filled with personal 
and social meaning. Clearly, these groups ofwords are not devoid of 
meaning as texts. To their authors, they represent textual associations 
that will make it easier tofind the resource again in thefuture (one can 
assume, for example, that the tag to_read is used to classify resources 
that the user intends to read later). Fach group of tags is the user's 
framing of the resource according to a personal scheme. At the same 
time, however, the fact that certain keywords (such as folksonomy, 
social, del.icio.us, ontology, etc.) are repeated across groups suggests 
that some of these words have a socially shared meaning apart from 
their personal meaning. This socially shared meaning is what would 



allow someone browsing through those tags tofind that same resource, 
or similar ones. 



Tags sind also nicht nur freie Schlagworte, die den Inhalt einer Ressource beschreiben, 
sondern auch persönliche Referenzen für einzelne Nutzer, die ihnen helfen, bekannte Inhalte 
zu einem zukünftigen Zeitpunkt wieder zu finden. Die zentrale Aussage von Mejias zu die- 
sem Punkt ist, dass jede Gruppe von Tags (diejenigen, die von einem Benutzer für eine Res- 
source genutzt wurden) eine Repräsentation dieser Ressource aus Sicht dieses einen Benut- 
zers ist. Sinah (vgl. [Sinah2005]) schreibt dazu: 
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have explored this phenomenon by asking [by 



asking] people to list semantic associations with an object, and mapping 
the type and frequency of associations. Another method is to use implicit 
memory measures to probe what concepts have been activated. With the 
advent offMRIf^^J, it is possible to correlate such concept activation to 
changes in blood flow to difference parts of the brain. The details ofthis 
are not relevant for the present discussion, what's relevant is that there is 
broad agreement about such conceptual activation in cognitive psychology. 
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Er beschreibt den Taggingprozess mit dieser Abbildung: 

Cognitive process beliind tagging 



Q <^ 



w 



Äs 

l^^^^^^^^^H Object worth Multiple concepts are 
^^^^^^^^^^remembering (articie, activated 

Image, book...) 

Abbildung 2-5: Ablauf des Taggingprozess nach Sinah. 



Stage 1 



-► Tag it! 

Write down 
activated concepts 



c Motivation 

Marlow et al. (vgl. [Mario w2005]) unterteilen die grundlegenden Motivationen von Nut- 
zern, Taggingsysteme zu nutzen, in zwei Klassen: organizational und social. Sie verstehen dar- 
unter zum einen die Motivation, eine strukturierte Ablage für Ressourcen zu schaffen. Solche 
Nutzer entwickelten einen persönlichen Standard, angelehnt an die im System vorherrschen- 
den Nutzungsverhalten: 

In einem Video^^ zeigt Udell, wie er in del.icio.us eine Ressource mit dem Tag „digitalide- 
nity" versieht. Er prüft seine übrigen mit diesem Tag versehenen Ressourcen und stellt fest. 



22 Functional magnetic resonance imaging - funktionelle Kernspintomographie. Siehe http://en.wikipedia.Org/w/ 
index.php?title=Functional_magnetic_resonance_imaging&oldid=68390787 - Zugegriffen am 1 1.08.2006. 

23 Siehe http://weblog.infoworld.com/udell/gems/delicious.html-Zugegriffenam 17.07.2006 
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das zwei dieser Ressourcen von anderen Nutzern nicht mit „digitahdenity", sondern „cert" 
für certificate getaggt w^urden. Daraufhin löscht er für diese beiden Ressourcen das Tag „digi- 
talidentity'' und ersetzt es durch „digitalcertificate". Er stellt auch fest, dass er in der Vergan- 
genheit statt „digitalidenity" das Tag „identity" verwendet hat und ersetzt daraufhin alle 
Vorkommen von „digitalidentity" durch „identity". 

Zum anderen gibt es Nutzer, die vorwiegend sozial motiviert sind. Sie nutzen Tagging- 
systeme, um ihre Meinungen über Ressourcen (z. B. „funny", „boring") wiederzugeben und 
Besonderheiten (z. B. „violence'', „adult") hervorzuheben. 

Beide Ansätze unterscheiden sich in dem Zielpublikum sowie in der Erwartung der späte- 
ren Nutzung durch den Nutzer selbst. Marlow et al. beschreiben sechs verschiedene Motiva- 
tionen: 

1. Future retrieval 

2. Contribution and sharing 

3. Attract Attention 

4. Play and competition 

5. Seif presentation 

6. Opinion expression 

i Future retrieval 

Das Taggen von Ressourcen zur späteren Nutzung, entweder einzelner Ressourcen oder 
einer Menge mehrerer Ressourcen (zum Beispiel in Vorbereitung einer Diplomarbeit). Tags 
der Klasse Task organizing (siehe S. 18), die konkrete Aufgaben beschreiben, wie „toread'' 
und ähnliche, wurden aus dieser Motivation heraus vergeben. 
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ii Contribution and sharing 

Damit gemeint ist die Motivation, Ressourcen für andere bereit zu stellen, um sie auf et- 
was aufmerksam zu machen oder sie auf etwas hinzuweisen. Beispielsweise das Taggen von 
Reiseinformationen für den Partner oder Fotografien einer Veranstaltung: Der Web 
Montag^^ der seit Anfang des Jahres in mehreren deutschen Städten stattfindet, weist auf sei- 
ner Website darauf hin, wie man in den verschiedenen Taggingsystemen taggen (i. d. R. mit 
dem tag „webmontag", oder auch „webmontag20060814" [Dieses Tag steht für den kom- 
menden Webmontag am 14.08.2006.]) soll, damit andere zusammengehörige Inhalte finden 
können. Im Grunde geht es um eine Vereinbarung innerhalb einer Gruppe von Menschen, 
für bestimmte Inhalte das gleiche Tag zu nutzen, um das Auffinden zusammengehöriger In- 
formationen zu erleichtern. 

iii Attract Attention 

Die Motivation, Aufmerksamkeit zu erzeugen, spiegelt sich in Taggingsystemen darin 
wieder, dass so motivierte Nutzer vor allem solche Tags vergeben, die einen hohen Grad an 
Aufmerksamkeit genießen. Tag Clouds oder ähnliche Listen der meist genutzten Tags geben 
diesen Nutzern Hilfestellung. Auch kann die Motivation darin liegen, ein Tag in diesen Lis- 
ten und Darstellungen zu „pushen" oder ein gänzlich neues einzuführen. 

iv Play and competition 

Tags nach einem Regelwerk zu vergeben, wie im ESP Game^^ wo der Nutzer ein Bild so 
taggen sollen, wie er meint, dass andere Nutzer es auch tun, oder wie zum Beispiel bei 
Odeo^^ als Odeo-Nutzer einen Versuch starteten, Tags so zu vergeben, dass sich in der Tag 
Cloud Sätze bildeten. 



24 Siehe http://www.webmontag.de/ - Zugegriffen am 1 1.08.2006. 

25 Siehe http://www.espgame.org/ - Zugriffen am 17.07.2006. 

26 Siehe http://www.odeo.com/ - Zugegriffen am 17.07.2006. 
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V Seif presentation 

Tags, die aus dieser Motivation heraus vergeben werden, beschreiben den Bezug des Nut- 
zers zur getaggten Ressource. Zum Beispiel das Tag „seen live" auf last.fm^^ - einer Plattform 
zum Taggen vom Musikstücken und Künstlern. Es beschreibt die Tatsache, dass der Nutzer 
dieses Musikstück oder diesen Künstler in einem Konzert erlebt hat. Tags der Klasse Seif re- 
ference (siehe S. 18), die die Beziehung zwischen Nutzer und Ressource beschreiben, wurden 
aus dieser Motivation heraus vergeben. 

vi Opinion expression 

Findet ein Nutzer eine Ressource besonders nützlich (oder unnütz), lustig, informativ, 
spannend u. ä., möchte er seine Meinung mit anderen Nutzern teilen und benutzt dafür Tags 
der Klasse Identifying qualities or characteristics (siehe S. 18) wie zum Beispiel „funny'', „bo- 
ring" oder „well-written". 



d Ausprägungen von Taggingsystemen 

Betrachtet man die verschiedenen Taggingsysteme, fällt auf, dass sie zwar alle auf Tag- 
ging basieren, sich in der Implementierung einzelner Funktionen jedoch stark unterscheiden. 
Marlow et al. haben aus diesen Beobachtungen eine Taxonomie von Taggingsystemen erar- 
beitet, die im folgenden dargestellt wird. 

Sie unterscheiden sieben Dimensionen: 

1. Tagging Rights 

2. Tagging Support 



27 Siehe http://last.fm/ - Zugegriffen am 17.07.2006 
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3. Aggregation 

4. Type of object 

5. Source of material 

6. Resource Connectivity 

7. Social Connectivity 



i Tagging Rights 

Diese Dimension macht eine Aussage darüber, welcher Nutzer welche Ressourcen taggen 
und die Tags verwalten darf. Sie spannt sich auf von restriktiven Systemen, in denen nur 
derjenige Nutzer eine Ressource taggen darf, der sie zuerst dem System bekannt macht 
(„self-tagging" nach Marlow et al.), bis zu offenen („free-for-air' nach Marlow et al.) Syste- 
men, die jedem Benutzer erlauben, jede Ressource zu taggen. Die Unterschiede in den einzel- 
nen Implementierungen sind fein granuliert und folgen dem gesamten Bogen. Ein ähnlich 
weiter Bogen überdacht die Ausprägungen der Antwort auf die Frage, wer ein Tag löschen 
darf. Die Positionierung eines Taggingsystems innerhalb dieser Dimension hat direkte Aus- 
wirkungen auf die Tags, die in ihm benutzt werden. „free-for-air'-Systeme ordnen einer Res- 
source viele Tag-Gruppen zu, wobei die Tags selbst sehr unterschiedlich sein können, „self- 
tagging''-Systeme hingegen ordnen jeder Ressource nur eine einzige Tag-Gruppe zu. So 
kommt es in solchen Systemen vor allem darauf an, wer und aus welcher Motivation heraus 
derjenige eine Ressource taggt. Der Fotograf selbst würde einer Fotografie andere Tags mit- 
geben als eine beliebige dritte Person es tun würde. 
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Dimension 


Main categories 


Summary of potential implications 


Tagging Rights 


self-tagging, permission-based, free-for-all 


Nature and type of resultant tags; role 
of tags in System 


Tagging Support 


blind, suggestive, viewable 


Convergence on folksonomy or 
overweighting of tags 


Aggregation model 


bag, set 


Availability of aggregated statistics 


Object type 


textual, non-textual 


Nature and type of resultant tags 


Source of material 


user-contributed, System, global 


Different incentives, nature and type 
of resultant tags 


Resource Connectivity 


links, groups, none 


Convergence of similar tags for linked 
resources 


Social Connectivity 


links, groups, none 


Convergence on localized folksonomy 



Tabelle 2: Dimensionen des Designs von Taggingsystemen nach Marlow et al. 

Hammond et al.^^ ordnen Taggingsysteme nach der Frage, wer den Inhalt erstellt hat so- 
wie wer den Inhalt taggen darf. Sie benutzen dazu das Diagramm aus Abbildung 2-6, S. 33. 



Nach Hammond et al. bewegen sich Nutzungsszenarien aus dem unteren linken Qua- 
dranten, in dem eigene Inhalte für eigene Zwecke getaggt werden (selfish) in den oberen 
rechten Quadranten (altruistic), während sich die meisten Taggingsysteme im unteren rech- 
ten Quadranten wiederfinden, in dem Nutzer fremde Inhalte für eigene Zwecke taggen. Der 
obere linke Quadrant nimmt HTML Meta Tags sowie Technorati auf, beides Systeme um ei- 
gene Inhalte für andere zu erschließen. Wikipedia benutzt ein Kategorienschema zur Inhalts- 
erschließung, keine Tags. Warum Hammond et al. es dennoch erwähnen, bleibt offen. 
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Tag 

Users 





Technorati 




lers 


HTML Meta Tags 
[Dublin Gore] 


(Wikipedia) 






CiteULike 






Connotea 






del.icio.us 


Seif 


Flickr 


Prassle 

Furl 

Simpy 

Spurl.net 

unalog 



Seif 



Others 



Content Creators 

Abbildung 2-6: Einordnung der Taggingsysteme nach Hammond et al 
Die Systeme im oberen rechten Quadranten, Technorati^^ HTML Meta Tags und auch Me- 
tadaten nach Dublin Core sind im eigentlichen Sinne keine Tags, da sie nicht in einer Folkso- 
nomy zusammengefasst werden können. Technorati-Tags bilden hier eine Ausnahme, weil 
Technorati als zentrale Stelle diese Tags durchaus zusammenfasst. Jedoch besitzen sie nur in 
Weblogs Relevanz und sind daher als spezialisierte Version von HTML Meta Tags oder An- 
gaben nach Dublin Core zu sehen. 

Thomas Vander Wal (vgl. [VanderWal2005]) beschreibt „broad'' und „narrow'' Folksono- 
mies. Auch wenn Marlow et al. Vander Wals Beschreibung nicht erwähnen oder referenzie- 
ren, so gleicht ihre Definition von „free-for-all" und „self-tagging" doch sehr Vander Wals 
„broad"- und „narrow''- Ansätzen. Vander Wal fügt seiner Begriffserklärung zwei Darstel- 
lungen (Abbildungen 2-7 und 2-8) bei, die das Konzept einer „broad" bzw. „free-for-all" und 
„narrow'' bzw. „seif -tagging" Folksonomy verdeutlichen. 



28 Technorati ist eine Weblog-Aggregator, der aus den publizierten Feeds von Weblogs eine Suche bereitstellt. 
Technorati-Tags sind eine für diese Website und ihre Dienste spezifische Anwendung. 
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Broad Forksonomy Narrow Folksonomy 




Content 
Creater 

Abbildung 2-7: Darstellung des Modells einer "broad 
folksonomy" nach V ander Wal. 




Content 
Creator 

Abbildung 2-8: Darstellung des Modells einer "narrow 
folksonomy" nach V ander Wal. 



ii Tagging Support 

Diese Dimension hat nach Marlow et al. drei Ausprägungen: „blind tagging'', „viewable 
tagging'' und „suggestive tagging". 



Hat der Nutzer, während er eine Ressource taggt, keinen Zugriff auf Tags, die von ande- 
ren Benutzern für die gleiche Ressource vergeben wurden, wird dies „blind tagging" ge- 
nannt. Als „viewable tagging" bezeichnet man die Situation, wenn der taggende Nutzer die 
Tags anderer Nutzer sehen kann, „suggestive tagging" schließlich bezeichnet ein System, das 
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dem Nutzer auf Basis seiner früher eingegebenen oder von anderen für diese Ressourcen 
vergebenen Tags Vorschläge macht. Vorgeschlagene Tags können auch aus automatisch ex- 
trahierten Metadaten stammen oder können automatisch erkannte Synonyme anderer Vor- 
schläge sein. 

Auch Golder und Huberman gehen auf dieses Thema ein. Sie sagen: 
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4 user may use the suggested populär tags as a way oflooking to others to 
see what the "right" thing to do is. 



Golder und Huberman erklären diese Überlegung mit einem Verweis auf das Prinzip des 
„social proof, einer Hypothese von Cialdini (vgl. [Cialdini2001]): Menschen tendieren dazu, 
die Handlungen und Handlungsweisen der Menschen in ihrer direkten Umgebung nach- 
zuahmen. 

Daraus schließen Marlow et al., dass suggestive Systeme helfen könnten, konvergentere 
Folksonomies zu bilden, da sie Nutzern dazu raten, bereits von anderen genutzte Tags zu 
vergeben. 

iii Aggregation 

Systeme unterscheiden sich auch in der Art und Weise, welche Tags sie je Ressource spei- 
chern. Wo manche Systeme eine beliebige Zahl von Tag-Gruppen zulassen - nach Marlow et 
al. ein „bag-model" - erlauben andere nur eine einzige Tag-Gruppe - ein „set-model". Van- 
der Wal hat diesen Ansatz ebenfalls in seine beiden Modelle einfließen lassen (siehe Abbil- 
dungen 2-7 und 2-8). 

iv Type of object 



Nachdem zunächst Webseiten getaggt wurden, kamen schnell andere Inhalte hinzu. Bil- 
der, Videos und andere Ressourcen, die online repräsentiert (direkt oder indirekt, zum Bei- 
spiel in Katalogen von Museen (siehe Abschnitt steve.museum, S. 12f ) sind. Auch Objekte 
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der physikalischen Welt werden getaggt^^ genauso wie Veranstaltungen aller Art^°. Auch in- 
nerhalb einer Klasse, zum Beispiel Webseiten, werden mittlerweile Unterschiede gemacht. 
Wo del.icio.us jeden per URL erreichbaren Inhalt zulässt, wird CiteULike dazu benutzt, aus- 
schließlich wissenschaftliche Veröffentlichen in sogenannten „libraries" zu sammeln. 

Auch wenn es bislang keine Untersuchungen zu diesem Thema gibt, vermuten Marlow et 
al., dass der Typ der Ressource eine Auswirkung auf die Tags hat, die ihm von den Nutzern 
zugeordnet werden. 

V Source of material 

Dieser Aspekt unterscheidet die Quellen einer Ressource nach Hersteller oder Besitzer, 
dem System, und einer grundsätzlichen Offenheit. Systeme wie Flickr erlauben nur den Her- 
steller oder Besitzer als Quelle, das ESP Game stellt von sich aus Inhalte bereit und del.icio.us 
erlaubt es, dem System beliebige Webinhalte hinzuzufügen. 

vi Resource Connectivity 

Konnektivität drücken Marlow et al. in den Begriffen „linked", „grouped" und „none" 
aus. Beispielsweise sind zwei Webseiten „linked'', wenn sie auf einander verweisen. Inner- 
halb von Flickr kann man Fotografien Gruppen zuordnen, was „grouped'' entspräche, 
„none'' bedeutet, das es keine Möglichkeit gibt, Ressourcen zueinander in Verbindung zu 
bringen. 

Marlow et al. äußern die Vermutung, dass die Verbindung von Ressourcen zu einer Kon- 
vergenz der verwendeten Tags führen könnte, vor allem in „suggestive tagging"- und „view- 
able tagging''-Systemen, die nach dem „bag-model'' arbeiten, also mehrere Tag-Gruppen pro 
Ressource zulassen. 



29 Siehe http://www.semapedia.org/ - Zugegriffen am 1 1.08.2006. 

30 Siehe http://upcoming.org/ - Zugegriffen am 1 1.08.2006. 
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vii Social Connectivity 

Die gleichen Begriffe betreffen auch die Verbindung der Nutzer untereinander. Hier iden- 
tifizieren Marlow et al. Unterdimensionen, so zum Beispiel den Typ einer Verbindung zwi- 
schen zwei Nutzern (Freund oder Kontakt^\ reine Beobachtung^^, ...), ob die Verbindungen 
gerichtet sind und ob sie symmetrisch sind bzw. sein müssen. 

Die Auswirkungen der Dimension des sozialen Systems bzw. des gegenseitigen Bezugs 
der Nutzer eines Taggingsystems könnten die Bildung lokalisierter Folksonomies basierend 
auf der sozialen Struktur des Gesamtsystems sein. 

e Vorschläge zur Verbesserung des Tagging-Prozesses 

Es liegen einige Vorschläge zur Verbesserung von Tags und des Taggingprozesses selbst 
vor. Mejias zum Beispiel hält eine ganze Reihe von Maßnahmen für nützlich. 

Zunächst schlägt er vor, Tags, die als Kategorien dienen, im Plural anzulegen. Weiterhin 
sollte man grundsätzlich Kleinschreibung verwenden und Großschreibung nur da, wo es un- 
bedingt notwendig ist, zum Beispiel bei Eigennamen (von Personen und Institutionen) oder 
Abkürzungen. Benutzer von Taggingsystemen (von Mejias DCS - Distributed Classification 
Systems genannt) sollten nicht nur spezielle Tags nutzen, sondern auch allgemeine Begriffe 
verwenden, um anderen Benutzern das Auffinden einer Ressource zu erleichtern. Er rät auch 
dazu, persönliche Tags (toread, print_this, funny, clever, ...) nicht ausschließlich zu nutzen, 
sondern immer auch für andere Nutzer sinnvolle Tags zu verwenden. Mehrwortige Tags wie 
„open source'' sollten nicht in ihre Bestandteile gespalten werden, um die Wiederauffindbar- 
keit besser zu gewährleisten. Technisch besteht hier noch das Problem, dass nicht alle Tag- 
gingsysteme solche Zusammenführungen erlauben und es noch keinen Standard gibt, solche 
Zusammenführungen abzubilden. Wie im Abschnitt Zusammengesetzte Begriffe, S. 23f, ge- 
zeigt, hat sich noch kein Standard etabliert, wie zusammengesetzte Begriffe getrennt werden 
sollten. Mejias schlägt auch vor, synonyme Begriffe für einzelne Tags zu benutzen. Gerade 



3 1 Möglich bei Flickr. 

32 Das deLicio.us-„network" basiert auf dieser Idee. Siehe Abschnitt Navigation in del.icio.us, S. 67ff. 
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bei Begriffen, von denen klar ist, das sie viele akzeptierte Synonyme haben sei dies sinnvoll. 
Letztlich ermahnt Mejias Benutzer von Taggingsystemen, ihr System genau zu beobachten 
und sich an bestehende Regeln (die meist nicht ausformuliert sind sondern oft „ungeschrie- 
bene Gesetze'' sind) zu halten und schließlich die Möglichkeiten zur Verbesserung der eige- 
nen (und fremder, wenn vom System erlaubt) Tags zu nutzen und so zur Verbesserung des 
gesamten Systems für alle Nutzer beizutragen. 

Melzer (vgl. [Melzer2005]) schlägt vor, bestimmte Tag-Typen mit Sonderzeichen zu verse- 
hen. So könne man zum Beispiel persönliche Tags wie „toread" mit einem Ausrufezeichen 
versehenen (für eine zusammenfassende Übersicht siehe Sonderzeichen in Tags, S. 22f). Er 
rät außerdem, sowohl allgemeine als auch spezialisierte Tags zu benutzen, um die so getagg- 
ten Ressourcen später besser einordnen zu können. 

Wie im Abschnitt Tagging Support, S. 34, beschrieben, gibt es unterschiedliche Ansätze, 
den Nutzer bei dem Tagging-Prozess zu unterstützen. Melzer (vgl. [Melzer2006]) schlägt 
dazu eine Erweiterung der Benutzeroberfläche vor, bezogen auf del.icio.us. Zum einen soll- 
ten dem Benutzer diejenigen Tags angezeigt werden, die er in der Vergangenheit bereit für 
Ressourcen der gleichen Quelle benutzt hat („Tags suggested based on tags I've used on this 
domain before''), zum anderen sollte del.icio.us eine Liste derjenigen Benutzer bereitstellen, 
die die gleiche Ressource bereits getaggt haben. In dieser Liste soll auch angezeigt werden, 
ob die Nutzer zu den Top 10, 50, 100 oder 1000 aller del.icio.us-Nutzer zählen. Melzer dazu: 



Personally, I like to know how many other folks have bookmarked the item 
already. [...] Knowing who eise tagged the item gives me a sense ofwhe- 
ther this is a new meme or something that has already peaked. I also use 
this tofindgood taggers and early taggers andfollow their links. 



f Kollaborativer Ansatz 



Tagging ist fast immer als kollaborativer Ansatz implementiert. Das bedeutet zum einen, 
dass das System nach dem „bag-model" arbeitet und zum anderen, dass jeder Nutzer jede 
Ressource taggen und so in seine Sammlung aufnehmen kann. Der Nutzen dieser Systeme 
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Abbildung 2-9: Graph eines dreiseitiges Netzwerks nach Lambiotte 
undAusloos, das den Ansatz von Taggingsystemen zeigt. 



steigt mit der Zahl der teilnehmenden Benutzer. Je nach Implementierung können Benutzer 
alle Ressourcen sehen, die das System kennt, gemeinsam mit allen Benutzern, die eine Res- 
source getaggt haben sowie die Tags selbst, die dabei verwendet wurden. In diesem Sinne ist 
Tagging zumeist ein dreiseitiges Netzwerk (vgl. [Lambiotte2005]): 



The structure of collaboraüve Websites can he viewed as a tripartite 
network. Namely, it is a network composed ifthree kind ofnodes: i) the 
persons or users //; ü) the items i that can be music groups or scientific 
articles; iii) the tags I that are used by the person |i to describe the item 
i. Depending on the Systems under consideration, a person can use one 
or several tags on each item. The resulting network can be represented 
by a graph where edges run between the item i and the user \i, passing 



Darüberhinaus weisen sie den Verbindungen zwischen Benutzern und Ressourcen 



(„items'') eine Wertigkeit in Abhängigkeit der Anzahl der benutzten Tags zu: f^ 



1 steht 



dabei für die Anzahl der Tags, mit der /i eine Ressourcen getaggt hat. So kann jeder Nutzer ji 



als Matrix von ^ dargestellt werden: 
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Lambiotte und Ausloos schlagen auf dieser Grundlage Methoden vor, die aus Strukturen 
in Folksonomies Aussagen über Benutzergruppen (Benutzer, die ähnliche Inhalte ähnlich 
taggen) und zusammengehörige Ressourcen vor. 

Mika [Mika20005] beschreibt eine Folksonomy als Hypergraph [^ . V ist da- 

bei die Vereinigungsmenge von A (der Menge der „Actors'', der Benutzer), C (der Menge der 
„Concepts", der Tags) und I (der Menge der „objects", der getaggten Ressourcen): 

[g] . T ist dabei die Menge der Verbindungen zwischen Benutzern, Tags und 

Ressourcen: |g . E entspricht den Dreifachkanten zwischen allen Elementen 

von T: [^ 

Aus dieser Betrachtungsweise ergeben sich nach Mika Ansätze zur Extraktion von Onto- 
logien aus Folksonomies. 

Marlow et al. treffen im Grunde die gleiche Aussage, wenn sie sie auch weniger mathe- 
matisch betrachten als Lambiotte und Ausloos. Sie fügen jedoch eine weitere Dimension hin- 
zu, in dem sie die Möglichkeit offenlassen, dass es sowohl Verknüpfungen zwischen Res- 
sourcen als auch zwischen Benutzern geben kann: 



In this model, users assign tags to a specific resource; tags are repre- 
sented as typed edges connecting users and resources. Resources may 



be also he connected to each other (e.g., as links between web pages) 
and users may be associated by a social network, or sets of affiliations 
(e.g., users that workfor the same Company). 



Nach diesem Modell sind Verknüpfungen in Form von Links zwischen Ressourcen eben- 
so zu beachten wie mögliche Verbindungen zwischen Benutzern. 
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Benutzer 




Abbildung 2-10: Tagging-Modell nach Marlow et al. Je eine "Tag-Gruppe" 
stellt eine Verbindung zwischen einer Ressource und einem Benutzer her. 
Darüberhinaus können sich durch Verlinkung innerhalb der Ressourcen 
(Hyperlinks) Verbindungen zwischen Ressourcen ergeben sowie durch Zuge- 
hörigkeit zu Organisationen Verbindungen zwischen Benutzern. 



In Taggingsystemen ergeben sich also Beziehungen zwischen Benutzern und Ressourcen 
durch die von den Benutzern vergebenen Tags. Zu beachten ist, dass dies nur für Tagging- 
systeme gilt, die einen „bag-model" Ansatz haben. Bei „set-model" Ansätzen geht die Infor- 
mat-ion, welcher Benutzer ein bestimmtes Tag benutzt hat, verloren. 



CiteULike benutzt ein „bag-model". Es verknüpft also einen Benutzer über eine Tag- 
Gruppe eindeutig mit einer Ressource. Als Tag-Gruppe wird die Menge von Tags bezeich- 
net, die ein Benutzer einer Ressource zuordnet: 
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Ressource 



Tags 



Benutzer 



t1 , t2, t3 



Abbildung 2-11: Eine Tag-Gruppe, bestehend aus den Tags tl, t2 und 
tS, verbindet eine Ressource und einen Benutzer. 



Im Folgenden wird gezeigt, wie ein Werkzeug aussehen könnte, das anhand der Verbin- 
dungen zwischen Benutzern, Ressourcen und Tags Ressourcen finden kann, die ein Nutzer 




L1 n L2 = U1 




L1 n L3 = U2 

Abbildung 2-12: Schnittmengen dreier Bibliotheken LI, L2 und LS. Die Schnittmenge Ul umfasst weniger Elemente als 
U2. Damit sind die Elemente aus LS \ LI interessanter für mich als die L2 \ LI. 



noch nicht kennt, aber potentiell für ihn interessant sein könnten. 



i CoUaborative Filtering auf Basis von Tagging 



Die vier Hypothesen des im folgenden beschriebenen Ansatzes lauten: 
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1. „Teilt ein Benutzer viele Ressourcen mit mir, ist seine Bibliothek (L3) inter- 
essanter für mich als die eines anderen Benutzers, dessen Bibliothek (L2) eine 
kleinere Schnittmenge mit meiner (LI) hat (siehe Abbildung 2-12)/' 

2. „Ein Benutzer wird inhaltlich ähnliche Ressourcen immer gleich taggen 
oder zumindest ähnlich genug, dass man aufgrund der Tag-Gruppe der ein- 
zelnen Ressourcen zwischen sehr häufig und eher selten vergebenen Tags un- 
terscheiden kann/' 

3. „Nicht die gesamte Bibliothek L3 ist für mich interessant, sondern nur der 
Teil, den ich noch nicht kenne (L3 \ LI), und der mit ähnlichen Tags getaggt 
wurde wie die Ressourcen aus der Schnittmenge LI H L3/' 

4. „Je mehr Bibliotheken eine bestimmte Ressource beinhalten, desto größer 
ist das Interesse an dieser Ressource/' 

Um aus der Menge I = L3 \ LI diejenigen Ressourcen zu identifizieren, die interessant 
sein könnten, wird folgendes Vorgehen vorgeschlagen. 



1. Zunächst betrachtet man alle Elemente aus LI und prüft für jede Ressource, in 
welchen anderen Bibliotheken sie ebenfalls enthalten ist. Man erhält eine Liste von 
Bibliotheken, die man nach der Häufigkeit der Übereinstimmungen absteigend ord- 
net. Nun berechnet man den Median der gruppierten Häufigkeiten und verwirft alle 
Bibliotheken, die weniger Übereinstimmungen aufweisen: 



|L1 nL2| = 3 
|L1 nL3| = 5 
|L1 nL4|=3 
|L1 nL5|=4 
|L1 n L6| = 1 
|L1 n L7| = 1 



Median {5, 4, 3, 1} 

3,5 



Im weiteren würden 

nur noch L3 und L5 

betrachtet werden. 



Durch die Trunkierung der Liste hält man Bibliotheken mit zu kleinen Überschnei- 
dungen aus der weiteren Analyse heraus. 
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Nach Hypothese 1 hat man nun diejenigen Bibhothek identifiziert, die im Gesamt- 
system die meisten Ressourcen mit LI teilen. 

Beinhaltet die Bibliothek LI Ressourcen zu verschiedenen Interessengebieten, 
kann man, statt die gesamte Bibliothek zu betrachten, durch Angabe eines oder meh- 
rer Tags, die Menge der zu untersuchenden Ressourcen im Vorfeld einschränken. 
Auch könnte man die Relation der Anzahl der Ressourcen in einer dritten Bibliothek 
Lx zu ihrer Schnittmenge mit LI betrachten und den Bibliotheken damit ein Ranking 
zuweisen. Je größer der Anteil der Schnittmenge an der Gesamtgröße ist, desto wahr- 
scheinlicher ist es, dass Lx weitere relevante Ressourcen umfasst. Je kleiner der Anteil 
ist, desto breiter gestreut ist das Interessengebiet des Besitzers von Lx und desto klei- 
ner ist die Wahrscheinlichkeit, weitere relevante Dokumente zu finden. Diese Aussa- 
ge ist noch zu überprüfen und stellt lediglich eine Überlegung dar. 

2. Nun betrachtet man die Ressourcen aus LI H L3 und identifiziert die Tags, mit de- 
nen der Besitzer von L3 diese Ressourcen getaggt haben. So erhält man eine Liste von 
Tags, die man nach Häufigkeit des Vorkommens absteigend ordnet, den Median der 
Häufigkeiten berechnet und diejenigen Tags verwirft, die weniger oft vorkommen. 
Damit hat man das Vokabular V gefunden, mit dem der Besitzer von L3 die Ressour- 
cen innerhalb der Schnittmenge LI H L3 getaggt hat. 

Nach Hypothese 2 werden Ressourcen aus L3 \ LI, die denen aus LI H L3 ähnlich 
sind, mit Tags versehen worden sein, die in V enthalten sind. 

Durch das Erstellen eines Vokabulars für eine Teilmenge einer Bibliothek eines Be- 
nutzers umgeht man das Problem unterschiedlicher Tags, die von verschiedenen Be- 
nutzern für den gleichen Begriff gewählt wurden. Wie am Beispiel aus dem Video 
von Udell gezeigt wurde, können zwei Benutzer die gleiche Ressource aus unter- 
schiedlichen Motivationen heraus mit verschiedenen Tags getaggt haben. Indem man 
für die Suche in einer Bibliothek nur die Folksonomy (das in extrahierte Vokabular ist 
Teil der Folksonomy des Benutzers) der Bibliothek selbst nutzt, umgeht man das Pro- 
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blem der Disambiguierung, wenn man davon ausgeht, dass ein Benutzer für den 
gleichen Begriff immer das gleiche Tag benutzt. 

Um sicherzustellen, dass das gefundene Vokabular sinnvoll auf L3 \ LI anzuwen- 
den ist, sollte darauf geachtet werden, dass es nicht zu wenige Tags beinhaltet. Ge- 
nauso sollte es nicht zu viele Tags beinhalten. Man könnte also zum Beispiel, statt das 
Vokabular am Median abzuschneiden, mit relativen Werten arbeiten und V als die 
20% des Vokabulars definieren, die am häufigsten vorkommen, wobei V mindestens 
fünf Tags beinhalten muss. Desweiteren könnte man auch dem Benutzer die Mög- 
lichkeit geben, sich selbst aus dem gesamten Vokabular das Vokabular V zusammen- 
zustellen. Damit könnte der Prozess zwar nicht mehr automatisch ablaufen, aber 
eventuell gewinnt man dadurch bessere Suchergebnisse. Eine weitere Möglichkeit 
wäre die Benutzung einer Stoppwortliste, in der bekannte, nicht-deskriptive Tags wie 
„toread" enthalten sind. Eine solche Liste existiert nicht und müsste im Vorfeld er- 
stellt werden. 

3. Im nächsten Schritt betrachtet man die Ressourcen der Menge L3 \ LI und die 
Tags, mit denen sie vom Besitzer der Bibliothek L3 getaggt wurden. Man prüft für 
jede Ressource, wie groß die Übereinstimmung zwischen der benutzen Tag-Gruppe 
T und dem im vorherigen Schritt erstellten Vokabular V ist. Besteht keine Überein- 
stimmung, ist diese Ressource nicht interessant. Besteht eine Übereinstimmung, so 
wird die Mächtigkeit der Übereinstimmung I V H T I berechnet. 

Man könnte hier eine Grenze einfügen und bestimmen, dass die Mächtigkeit der 
Übereinstimmung mindestens x betragen muss. x kann zum Beispiel so definiert sein, 
dass es 50% oder 80% der Anzahl der Elemente aus V beträgt. So kann man strenger 
oder weniger streng filtern, sollte die Anzahl der Ressourcen der Treffermenge zu 
groß sein oder zu viele irrelevante Treffer geliefert werden. Die Ressourcen, bei de- 
nen I V n T I > X gilt, erhalten als Score I V H T I zugeordnet. 

Nach Hypothese 3 erhält man so eine gewichtete Liste von unbekannten, aber po- 
tentiell interessanten Ressourcen. 
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4. Nun wiederholt man die Schritt 2 und 3 für alle weiteren in Schritt 1 identifizier- 
ten Bibliotheken. Trifft man dabei auf eine Ressource, die auch in L3 \ LI enthalten 
ist, erhöht man ihren Score entsprechend Schritt 3. 

Nach Hypothese 4 erhöht man den Score einer Ressource, die in mehreren Biblio- 
theken auftaucht, um so abzubilden, dass sie potentiell interessanter ist als andere 
Ressourcen, die nur in einer oder weniger Bibliotheken auftaucht. 

Im Ergebnis erhält man eine gewichtete Liste von Ressourcen aus L3 \ LI und L5 \ LI, 
die mit Tags aus dem jeweiligen Vokabular getaggt sind und damit ähnliche Inhalte haben, 
wie die Ressourcen aus LI. 
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Abbildung 2-13: Darstellung des Ablaufs zur Identifikation 
interessanter und unbekannter Ressourcen. 



Dieses Vorgehen lässt sich für alle Taggingsysteme implementieren, die ein „bag-model" 
für Tags aufweisen, und die nach dem „free-for-air'-Prinzip aufgebaut sind, zum Beispiel 
del.icio.us oder CiteULike. 
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3 Folksonomy 
a Definitionen 

Der Begriff ist ein Kunstwort, bestehend aus dem englischen Substantiv /o/fc und dem 
griechischen nomia im Gegensatz zu Taxonomy, dass aus taxis, der Ordnung und nomia be- 
steht. Er beschreibt damit eine von Menschen erstellte Ordnung oder Handhabung. Folkso- 
nomy möchte im Gegensatz zu Taxonomy deutlich machen, dass die Ordnung nicht von 
vornherein festgelegt ist, sondern durch Benutzereingaben entsteht. 

Folksonomies entstehen im Zuge von Tagging, durch das Tagging. Eine Folksonomy stellt 
die Gesamtheit aller Tags dar, die Benutzer eines auf Tags basierten Systems bis zu einem be- 
stimmten Zeitpunkt eingegeben haben. So wächst eine Folksonomy durch Nutzung des Tag- 
gingsystems und verändert sich sich mit jeder Benutzer-Eingabe. 

Im Gegensatz zu professionell gepflegten Systemen gehen Folksonomies formale Aspekte 
völlig ab. Es fehlen Verweise und Verknüpfungen, Siehe- Auch-Hinweise und ähnliches. Es 
fehlen auch hierarchische Gliederungen, die Abhängigkeiten zu Ober- und Unterbegriffen 
deutlich machen. 

Ein weiterer Gegensatz ist die grundsätzliche Offenheit von Folksonomies. Glaubt ein Be- 
nutzer, dass es sinnvoll wäre, einer Ressource ein weiteres Tag zu geben, benutzt er es ein- 
fach und fügt damit der Folksonomy einen Begriff hinzu. 

Guy und Tonkin beschreiben Folksonomies daher so: 
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Sie führen weiter aus, dass eine Verbesserung des Taggingprozesses zu nutzbaren Tags 
führen könnte und dadurch den Ansatz eines offenen Vokabulars deutlich aufwerten würde. 
In Kapitel Tagging Support, S. 34, werden ihre Vorschläge aufgegriffen. 

b Struktur entsteht durch Wachstum 

Bei Folksonomies, den Taxonomien, die durch Tagging enstehen, lässt sich nach einer ge- 
wissen Zeit der Nutzung eine Struktur der Tags ablesen. So können recht schnell die am häu- 
figsten genutzten Tags hervorgehoben werden oder auch solche, die häufig mit einander ver- 
wendet werden. 

Diese Listen sind nicht statisch zu sehen, sondern dynamisch in der Zeit. Sie ändern sich 
im Laufe von Tagen, manchmal nur Stunden. Solche Abbildungen können daher immer nur 
Schnappschüsse sein. Folksonomies bieten weder Hierarchien noch Werkzeuge bekannter 
Ontologien oder Thesauri. Tatsächlich bilden sie immer nur in einen Ist-Zustand aller im Sys- 
tem benutzten Tags ab, ohne diese in Beziehungen zu setzen, wie kontrollierte Vokabulare 
dies tun. Natürlich sind Aussagen über die am häufigsten genutzten Tags oder die am häu- 
figsten gemeinsam vorkommenden Tags möglich, von reinen Anzahlen („Wie oft wurde Tag 
X benutzt?'') einmal abgesehen. 

In den meisten Systemen ist es nicht möglich, sprachlich zu unterscheiden, weshalb alle 
Tags in der selben Folksonomie landen, ohne Unterscheidung nach Sprache oder Einsatz- 
zweck. Die meisten Systeme führen selbst auch kein Stemming durch oder bereiten ihre Tags 
anders auf eine halb intelligente Weiterverarbeitung vor. Tatsächlich wird jedes Wort der na- 
türlichen Sprache, das technisch innerhalb des Regelsystems als Tag darstellbar ist, als sol- 
ches in die Folksonomie des Systems aufgenommen. 

c Folksonomies und das Power Law 

Golder und Huberman, und andere bemerken, dass die Häufigkeitsverteilung von Tags 
in einer Folksonomy einem Power Law^^ folgt- 



33 Siehe http://de.wikipedia.org/wiki/Power_law - Zugegriffen am 07.08.2006. 
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Power Laws beschreiben eine in vielen Gebieten nachgewiesene Verteilung von Mengen. 
Dabei geht man von exponentiellem Wachstum sowohl der Menge der beobachteten Objekte 
als auch ihrer Größe aus. So sind zum Beispiel die Städte und Ortschaften eines Landes, ab- 
steigend nach ihrer Größe geordnet, nach den Power Laws verteilt. Die Pareto-Verteilung 
und Zipfs Gesetz sind weitere Beispiele für Power Laws. 

Im Zusammenhang mit Tagging und Folksonomies wird häufig anstatt von einer Vertei- 
lung nach den Power Laws vom sogenannten „Long tail" (vgl. [Anderson2004]) gesprochen. 
Damit ist die Vielzahl der unterschiedlichen Tags und ihre Häufigkeit gemeint, mit der die 
Gesamtheit der Benutzer eine Ressource taggen. Hier ein Beispiel dafür, an dem im folgen- 
den die Bedeutung des „Long taiL' erläutert wird: 
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Abbildung 3-1: Verteilung der Tags für eine zufällig ausgewählte Ressource. 



Die Prinzipien hinter dem „Long tail"-Konzept, das seine Wurzeln in der Ökonomie hat, 
lauten nach Anderson: 

1. Make everything available. 



2. Cut prize in half. Now lower it. 
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3. Help me find it. 

Anderson, der dieses Konzept zum ersten Mal formulierte, argumentiert, dass man zwar 
mit 20% seiner Waren 80% des Gewinns macht, aber man darüber die übrigen 80% der Wa- 
ren nicht vernachlässigen sollte. Übertragen auf Folksonomies bedeutet das, dass 20% der 
Tags für 80% aller Ressourcen benutzt werden. Diese Prozentangaben sind natürlich nur Nä- 
herungswerte und nicht wörtlich zu verstehen. Die Verbindung zu Folksonomies ist die Of- 
fenheit der Folksonomies. Sie erlauben jedes mit einer Tastatur eingebbare „Wort" als Tag, 
ohne dabei den Nutzer in irgendeiner Art und Weise einzuschränken. Wie es dann dazu 
kommt, dass einzelne Tags so exponentiell häufiger vorkommen, liegt in der Natur von del.i- 
cio.us und allen Taggingsystemen begründet: sie sind nach den Prinzipien des „bag-models" 
(siehe Abschnitt Aggregation, S. 35) aufgebaut und erlauben jedem Nutzer, jede Ressource 
zu taggen („free-for-all", siehe Abschnitt Tagging Rights, S. 31). 

Man betrachtet im Fall von Folksonomies also die Häufigkeiten, mit der die einzelnen 
Tags vorkommen und vergleicht sie. Daraus folgen Diagramme wie in den folgenden Abbil- 
dungen. Sie wurden aus Daten erzeugt, die am 25.07.2006 von 14.00h bis 14.30h für zwei zu- 
fällig ausgewählte Benutzer von del.icio.us per RSS-Feed gewonnen wurden. Die Daten bein- 
halten alle Ressourcen, die jeder der vier Benutzer in seiner Link-Sammlung hat, sowie die 
dazu genutzten Tags. Durch Gruppierung der Tags und der Auswertung, welches Tag wie 
häufig im jeweiligen Datensatz vorkommt, konnten diese Diagramme erstellt werden. 



Nutzungshäufigkeit von Tags für Person I 
(217 Ressourcen, 288 Tags) 



Tags 



Abbildung 3-2: Häufigkeitsverteilung der Tags eines Nutzers von del.icio.us. 
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Abbildung 3-3: Häufigkeitsverteilung der Tags eines Nutzers von del.icio.us. 



d Visualisierung der Struktur 

i Tag Clouds 

Meist werden Folksonomien per Tag Clouds visualisiert. Dabei nimmt man ein Subset 
von Tags aus der Menge aller, meist die 100 häufigsten, ordnet sie nach dem Alphabet und 
vergrößert dann einzelne Tags je nach Nutzungshäufigkeit, so dass man beispielsweise die 
häufigsten zwanzig deutlich vergrößert darstellt. Statt durch Vergrößerung ist der Effekt 
auch mit Farben zu machen, wobei man auf eine Vergrößerung meist nicht verzichtet. Del.i- 
cio.us nutzt die Farbdimension, um solche Tags zu markieren, die man selbst bereits benutzt 
hat: 



Die in rot gedruckten Tags sind solche, die man selbst bereits benutzt hat. Wie zu sehen 
ist, liegt der Fokus der bei del.icio.us vornehmlich verwalteten Bookmarks auf technischen, 
internet-relevanten Themen. 
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del.icio.us /tag / 

your bookmarks | your network | inbox | links for you | post 



populär I recent 
logged in as itst_ | settings | logout | help 



Populär tags on del.icio.us 



search | 



This is a tag cloud - a list of tags where size retlects popularity. 
sort: alphabetically | by size 

.net ajax apple architecture aft articie audio blog blogging blogs books business Community 
Computer cool CSS cuiture desigil development download education emaii entertainment Unance 
firefox flash fiickr food free freeware fun funny games google graphics gtd Hardware health histon/ home 
howlo html humor Inspiration internet java Javascript jobs library NnUX mac maps marketing 
media micmsoit mp3 mUSiC neWS online opensource osx photo photography photos 
Photoshop php piugin podcast polltlcs pmductivity prograPTinning python rails recipes 
reference research resources rss mby science search security Shopping social 
Software tech technology tips tOOlS toread travel tutorial tutorials ubuntu VideO Web 
Web2.0 Webdesign webdev wetsite Windows wishiist Wordpress work 
(red tags are tags you share with eveiyone eise) 



^ del.icio.us | about | blog | terms of Service | privacy policy | Copyright policy | contact us 

Abbildung 3-4: Screenshot der Tag Cloud von del.icio.us vom 11.05.2006. 

Im Moment sieht man immer wieder Beispiele für solche Tag Clouds an Stellen, bei denen 

man erkennt, dass weder Tags noch Folksonomies die Basis für die Abbildungen sein kön- 
nen. So werden Tag Cloud-ähnliche Designs als Navigationselemente für Websites benutzt, 
zum Beispiel bei McDonalds oder Yahoo! Tech: 
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Abbildung 3-6: Navigation auf http://ww.mcdonalds.de/ - Dargestellt als Tag Cloud. 
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Abbildung 3-7: Navigation auf http://tech.yahoo.com/ - Dargestellt als Tag Cloud 
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ii Interaktive Visualisierungen von Folksonomies 

Solche und andere Darstellungen von Folksonomies bedienen sich meist einer interakti- 
ven Grafik mittels Flash- oder Java-Programmen. Sie erlauben, die eigene Folksonomy visu- 
ell darzustellen und Zusammenhänge sichtbar zu machen. 

Delicious Soup 

Dieses^^ Werkzeug setzt einzelne Tags in Beziehung und zeigt so, welche Tags häufig mit 
anderen gemeinsam eine Tag-Gruppe bilden. Es visualisiert die Folksonomy eines einzelnen 
Benutzers auf Basis seiner Linksammlung bei del.icio.us. 
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Abbildung 3-8: Darstellung der persönlichen Tags mit Delicious Soup 



Delicious Soup zeigt anhand der Nähe zweier Tags, dass sie oft gemeinsam vorkommen 
und anhand der Größe, wie oft ein Tag insgesamt vorkommt. An dem folgenden Beispiel 
wird dies deutlich, in dessen Zentrum das Tag „api" steht. Der Mauszeiger steht über dem 
Tag „tags" (im Screenshot ist der Mauszeiger nicht zu sehen). 

Der Text am unteren Bildrand von Abbildung 3-9 lautet sinngemäß: tags (used 54 times) :: 
since 225 posts :: has 23 related (has 2 relations with api). Hierzu einige kurze Erläuterungen: 



34 Siehe http://www.zitvogel.com/delicioussoup/ - Zugegriffen am 04.06.2006. 
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Abbildung 3-9: Screenshot von Delicious Soup. Er zeigt die Visualisierung der Beziehungen des Tags "api". 

1. „tags (used 54 times)" - gibt Aufschluss über die Frage, wie oft dieses Tag in der 
untersuchten Folksonomy vorkommt. 

2. „since 225 posts" - diese Angabe entspricht dem Alter des Tags in der Folksono- 
my. Kennt man die Anzahl der Ressourcen der zugrunde liegenden Linksammlung, 
kann man mit der Angabe der Nutzungshäufigkeit eine näherungsweise Aussage 
über die Nutzungsfrequenz machen: teilt man das Alter eines Tags (gemessen in 
„posts'', also getaggten Ressourcen) durch die Nutzungshäufigkeit, erhält man die 
Frequenz, mit der dieses Tag benutzt wird. Hier also: 225 : 54 = 4,17. Das Tag „tags'' 
wird also durchschnittlich für jede vierte Ressource der 225 Ressourcen genutzt, die 
seit dem ersten Auftreten des Tag getaggt wurden. 

3. „has 23 related" - das Tag hat seinerseits Verbindungen zu 23 anderen Tags 
,taucht also mit ihnen gemeinsam in verschiedenen Tag-Gruppen auf. 



3 Folksonomy 



55 



4. „has 2 relations with 'api"' - es gibt zwei Ressourcen in der Linksammlung, die 
mit „api'' und „tags'' getaggt wurden. 

Delicious Soup ist als Hilfsmittel zu sehen, das dem Benutzer Einblicke in die Folksonomy 
seiner Linksammlung gibt. Durch die interaktive Darstellungsweise kann er durch 
Mausklicks seine Tags „entdecken" und Zusammenhänge leichter erschließen, als dies durch 
eine Tag Cloud möglich wäre. 

Ravelicous 

Ravelicous^^ stellt drei Visualisierungen zur Verfügung, SpaceNav, TagClouds und Grou- 
per. Es benutzt als Basis die Folksonomy eines einzelnen Benutzern von del.icio.us. 

SpaceNav ist eine spielerische Visualisierung, die zur Darstellung der Beziehungen einzel- 
ner Tags dient. Es repräsentiert einzelne Tags als Kreise. Je größer der Kreis, desto häufiger 
wurde das Tag innerhalb der Folksonomy benutzt. 
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Abbildung 3-10: Visualiserung der Beziehungen des Tags "cool" mit Ravelicous SpaceNav. 



35 Siehe http://www.ivy.fr/revealicious/ - Zugegriffen am 04.05.2006. 
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Im Hintergrund des Screenshots aus Abbildung 3-10 sieht man weiße Kreise und sie ver- 
bindende Linien. Dies ist eine Besonderheit von SpaceNav: die Darstellung des Klick-Pfades 
(„path"), den man durch die Visualisierung bisher genommen hat. Klickt man auf die Reprä- 
sentation eines Tags in der rechten Bildhälfte, wechselt man zur Darstellung der Beziehun- 
gen dieses Tags. SpaceNav erstellt dann eine weiße Linie, die dieses neugewählte Tag mit 
dem vorherigen verbindet. 

TagClouds stellt die Tags einer Folksonomy in einer ähnlichen Form dar, wie statische Tag 
Clouds das tun. Durch die Interaktivität jedoch gewinnt die Darstellung an Informations- 
wert. In der Darstellung werden die am häufigsten benutzten Tags mit einem weißen Hinter- 
grund versehen. Tags ohne Hintergrundfarbe werden im Vergleich weniger oft und hellere 
Tags kaum benutzt. 
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Abbildung 3-11: Visualierung der Beziehungen eines Tags mit TagClouds. 



Ausgewählt ist hier das Tag „usability". Es steht mit den Tags mit rotem Hintergrund in 
Beziehung. Je heller die rote Färbung, desto weniger oft kommt „usability'' mit diesem Tag 
in einer Tag-Gruppe vor. Oben rechts ist das Tag „cool" mit einem weißen Hintergrund ver- 
sehenen. Dies zeigt an, dass dieses Tag sehr oft in der Folksonomy vorkommt. 
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Die Visualisierung mit TagClouds bietet darüber hinaus die Möglichkeit, mehrere Tags in 
die Textzeile am unteren Bildrand zu ziehen und dann alle Ressourcen anzuzeigen, die mit 
diesen Tags getaggt wurden. 
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Abbildung 3-12: Die gezoomte Darstellung einer Folksonomy mit TagClouds stellt den Text viel zu 
klein dar und macht ihn so unleserlich. 



Die in den beispielhaften Screenshots gezeigten Folksonomies sind recht klein, bestehen 
also aus nur wenigen Tags. Ist die Folksonomy größer, wird die Navigation unübersichtlich, 
weil nicht mehr die gesamte Folksonomy im Navigationsbereich sichtbar ist, sondern nur 
noch ein Teil. Zwar kann man die Darstellung verkleinern und vergrößern, doch wird die 
Schrift dann so klein, dass man nichts mehr erkennen kann. 

Grouper ist ein Versuch eines interaktiven Folksonomy-Managers. Außerdem stellt es ähn- 
liche Informationen über einzelne Tags und ihre Beziehungen bereit, wie SpaceNav und Tag- 
Clouds es tun. 

Hier wurde das Tag „bookmarking" ausgewählt und mit Grouper automatisch die mit 
ihm in Beziehung stehenden Tags zu einer Gruppe zusammengefasst. 
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Abbildung 3-13: Grouper bietet die Möglichkeit, Tags nach Gruppen zu ordnen. Wie TagClouds ist es mit 
Folksonomies überfordert, was den Raum der Anzeige (Viewport) angeht. 

iii Touchgraph- Visualisierungen 

Touchgraph^^ ist ein in der Programmiersprache Java geschriebenes Framework zur gra- 
phischen Darstellung von Netzwerken jeglicher Art. Eaton hat mittels dieses Frameworks ein 
Visualierungswerkzeug erstellt, das Verhältnisse zwischen Tags abbilden kann. Sein Werk- 
zeug betrachtet dabei die gesamte Folksonomy von del.icio.us. 

Abbildung 3-14 zeigt die Verbindungen der Tags „tagging" und „folksonomy". Zunächst 
wurden die Relationen für „tagging" dargestellt. Eine der Relationen von „tagging" ist 
„folksonomy". Durch einen Doppelklick auf „folksonomy" spannte sich auch dessen Bezie- 
hungsnetzwerk auf. 

Eine weitere Abbildung^^ zeigt das Beziehungsnetzwerk von „socialsoftware" mit weite- 
ren aktivierten Netzwerken. Neben „socialsoftware" werden die Netzwerke von „wiki", 
„web", „music", „del.icio.us", „folksonomy" und weiteren Tags geöffnet. Touchgraph ver- 
knüpft dabei bereits angezeigte Tags mit denen aus neu aktivierten Netzwerken, so dass eine 
Gesamtübersicht der Beziehungen besteht. So gehört „ontology" zum Netzwerk von „meta- 



36 Siehe http://touchgraph.sourceforge.net/ - Zugegriffen am 15.05.2006. 

37 Siehe http://many.corante.com/archives/2005/01/26/visuaHzing_the_conective_brain.php - Zugegriffen am 
15.05.2006. 
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Abbildung 3-14: Visualisierung der Beziehungen der Tags "tagging" und "folksonomy" mit Touchgraph. 

data" welches wiederum zum Netzwerk von „folksonomy" gehört. Zu seinem eigenen Netz- 
werk gehört „web", was auch Teil des Netzwerks von „socialsoftware" ist. 
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Abbildung 3-15: Visualisierung der Beziehungen rund um "socialsoftware". 
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4 Kritik 

Noch fehlen Folksonomies die Möglichkeiten von Thesauren und Ontologien. Mit den Ar- 
beiten an Tag-Clustern (siehe Abschnitt Tag-Cluster, S. 80f) könnte sich diese Kritik bald als 
überholt betrachten lassen. Den meisten Klassifikationssystemen fehlt aber die Einfachheit 
der Nutzung, die Folksonomies bereitstellen. Der Benutzung zur Indexierung der Colon- 
Klassifikation beispielsweise geht ein Studium der Regeln voraus, so dass kaum ein Endnut- 
zer sie nutzen würde, um zum Beispiel seine Bookmarks zu verwalten. Auch ist das Ergebnis 
der Indexierung nach Colon für den Laien kaum verständlich. Die Ressource „Diagnostik der 
Lungentuberkulose in Frankreich 1989" würde im Ergebnis zu indexiert sein: „L, 
45:421 :3.53.N89''. Dies gilt auch für die Universal Decial Classification und weitere Klassifi- 
kationssysteme, die mit Trennzeichen unterschiedliche Beziehungen zwischen den Termen 
herstellen. Klassifikationssysteme und kontrollierte Vobabularien wachsen nur langsam und 
das Hinzufügen neuer Begrifflichkeiten bedarf Genauigkeit und sehr gute Kenntnisse des 
Systems. An der Dewey-Dezimalklassifikation wird dies besonders deutlich. Die Festlegung 
auf Breite und Tiefe einer solchen Klassifikation behindert ihr zukünftiges Wachstum und 
macht Änderungen fast gänzlich unmöglich. Doch natürlich haben diese Systeme auch Vor- 
teile gegenüber Folksonomies. 

Das Problem der Disambiguierung stellt sich regelmäßig in Folksonomies. Neben dem er- 
wähnten Beispiel im Abschnitt Homonyme und Synonyme, S. 19, an dieser Stelle einige wei- 
tere, die diesen Aspekt näher erläutern. Der Begriff „queso'' steht in der spanischen Sprache 
für „Käse". Betrachtet man die Ressourcen, die mit diesem Begriff bei del.icio.us getaggt 
wurden^^ fällt auf, das sich die Bedeutung dieses Begriff innerhalb der Folksonomy von 
del.icio.us im Laufe der Zeit wandelte. Torres (vgl. [Torraumes2006])hat dies getan und 
kommt zu dem Schluss, dass vor dem 17.06.2006 mit dem Tag „queso" der spanische Begriff 
„Käse" gemeint war. Nach dem 17.06.2006 allerdings taucht das Tag immer wieder in Zu- 
sammenhang mit „Queso - a Semantic Web/Web 2.0 server"^^ auf, einem Atom^°-Server. In 



38 Siehe http://del.icio.us/tag/queso - Zugegriffen am 09.08.2006. 

39 Siehe http://torrez.us/archives/2006/07/17/471/ - Zugegriffen am 09.08.2006. 

40 Siehe http://www.atomenabled.org/ - Zugegriffen am 09.08.2006. Atom stellt ein Format für Content Syndication 
und ein Protokoll zum Datenaustausch im Rahmen des Atom-Formats bereit. 
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einem kontrollierten Vokabular könnte dies nicht geschehen, da diese Systeme extrem präzi- 
se und unmissverständlich sind. Vor allem die Synonym- und Homonymkontrolle ist eine 
Stärke kontrollierter Vokabularien/Thesauri gegenüber Folksonomies. 

Wie am Beispiel der Sonderzeichen in Tags, S. 22, deutlich wurde, können Folksonomies 
eine gewisse Ähnlichkeit mit Facettenklassifikationen haben. Dabei ist jedoch zu beachten, 
dass auch die Befürworter dieser Praxis immer dazu raten, auch und vor allem allgemeine, 
das heißt nicht mit Sonderzeichen versehene, Tags zu benutzen. Die Gefahr, sich hier mit 
Sonderzeichen und dergleichen zu verzetteln, ist natürlich dennoch gegeben. Es ist jedoch 
davon auszugehen, dass die Masse der Benutzer nicht zu dieser Praxis übergeht, schlicht 
weil sie - als informationswissenschaftliche Laien - kein Wissen über solche Methoden ha- 
ben. 

a Vorteile von Folksonomies 

Im Gegensatz zu kontrollierten Vokabularen und Klassifikationssystemen ist der Einstieg 
in eine Folksonomy für den Endnutzer wesentlich einfacher. Auch das Konzept des Taggens, 
der Grundlage von Folksonomies, ist leichter zu verstehen und aufzunehmen - abgesehen 
von der Tatsache, dass es nicht der Endnutzer ist, der Terme aus einem kontrollierten Voka- 
bular auf eine Dokumentarische Beschreibungseinheit anwendet, sondern ein Informationss- 
pezialist mit Fachausbildung. Die Einstiegshürde ist geringer, die Lernkurve weniger steil. 
Während Klassifikationssysteme vor allem als Hilfsmittel zur Suche eingesetzt werden („Ich 
suche Literatur über den Zusammenbruch der UdSSR im Zusammenhang mit der Wieder- 
vereinigung Deutschlands sowie der Gewerkschaftsbewegung in Polen."), dienen Folksono- 
mies vor allem dem Browsing, dass heißt dem Entdecken von Information. Folksonomies bil- 
den auch die Sprunghaftigkeit und Schnelligkeit besser ab, die dem World Wide Web anhaf- 
tet. Durch die Gemeinschaftlichkeit bei der „Erstellung" von Folksonomies entwickeln sie 
sich unabhängig von Einzelnen und Einzelinteressen. Durch die Art und Weise der „Erstel- 
lung" von Folksonomies erhalten die Nutzer ein direktes Feedback auf ihre Indexierung ei- 
ner Ressource und können so weitere Ressourcen und Personen entdecken, die sie interessie- 
ren könnten. Folksonomies sind vor allem sind als Werkzeug zur Filterung und Entdeckung 
von Ressourcen zu sehen. 
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b Nachteile von Folksonomies 

Wie im Abschnitt Probleme, S. 19ff, beschrieben, ergeben sich aus der Freiheit, die der 
Nutzer im Taggingprozess genießt, einige Nachteile. Zunächst einmal das Problem der Am- 
biguität von Tags. Unterschiedliche Schreibweisen und unterschiedliche Bedeutungen glei- 
cher Tags machen es schwer, einzelne Tags in einen Kontext einzuordnen. Andererseits kann 
man, durch Betrachtung der Tag-Gruppe, zu der ein Tag gehört, sehr wohl Rückschlüsse auf 
die tatsächliche Bedeutung des Tags schließen. Gleichzeitig zeigen erste Ansätze (siehe Ab- 
schnitt Aus Folksonomies hierarchische Strukturen bilden, S. 78), dass es durchaus möglich 
ist, aus Folksonomies Cluster und damit ähnliche Strukturen wie in einem Thesaurus zu bil- 
den. Mit diesen Methoden könnte es möglich sein, aus den flachen Folksonomies polyhierar- 
chische Strukturen zu bilden. Allerdings müsste man diesen Vorgang regelmäßig wiederho- 
len, um keine wichtigen Veränderungen in der Folksonomy zu verpassen. Problematisch ist 
auch die Schreibung zusammengesetzter Begriffe zu sehen, bei der sich noch kein Defacto- 
Standard entwickelt hat. Jedoch ist davon auszugehen, dass dies in der nächsten Zeit ge- 
schieht. Interessant ist der Ansatz von Technorati, das jegliche Trennzeichen entfernt. So 
spielt es keine Rolle, ob man nach „opensource", „open source", „open-source" oder 
„open_source" sucht^\ 



41 Siehe http://technorati.com/tag/ - Zugegriffen am 09.08. 2006.Die leicht unterschiedlichen Ergebniszahlen der 
Suchen nach den verschiedenen Schreibweisen für „open source" ergeben sich, da Technorati diese Funktion erst 
nach Einführung der Tag-Unterstützung implementierte. 
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5 Taggingsysteme am Beispiel von del.icio.us 

Das bereits mehrfach erwähnte del.icio.us nennt sich selbst „del.icio.us - social bookmar- 
king". Es stellt das größte auf Tagging basierte System dieser Art dar und ist seit Ende 2003 
öffentlich zugänglich. Im Folgenden wird del.icio.us in die Systematik von Taggingsystemen 
eingeordnet und der Ablauf des Taggingprozesses beschreiben. Schließlich wird die Naviga- 
tion in del.icio.us erläutert und der Nutzen dieser Art von System dargestellt. 

a „global suggestive free-for-all bag-model'' 

Ausgehend von der im Abschnitt Ausprägungen von Taggingsystemen, S. 30ff, erläuter- 
ten Systematik ordnet sich del.icio.us wie folgt in diese Ordnung ein. 



Dimension 


Main categories 


del.icio.us 


Tagging Rights 


self-tagging, permission-based, free- 
for-all 


free-for-all 


Tagging Support 


blind, suggestive, viewable 


suggestive 


Aggregation model 


bag, set 


bag 


Object type 


textual, non-textual 


textual & non-textual 


Source of material 


user-contributed, System, global 


global 


Resource Connectivity 


links, groups, none 


none 


Social Connectivity 


links, groups, none 


links & groups 



Tabelle 3: Einordnung von del.icio.us in die Dimensionen des Designs von Taggingsystemen nach Marlow et 
al. 



Tagging Rights - del.icio.us erlaubt es jedem Nutzer, jede Ressource im System sowie be- 
liebige neue Ressourcen zu taggen und dem System hinzuzufügen. 



Tagging Support - Bei der Indexierung eines neuen Dokuments unterstützt del.icio.us 
den Nutzer durch Vorschläge für Tags. Dabei zeigt es ihm nicht nur Vorschläge aus den 
Tags des Nutzers selbst, sondern auch solche Tags, die häufig von anderen Nutzern für diese 
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Ressource vergeben wurden. Ist die Ressource dem System bislang nicht bekannt, fallen die- 
se Vorschläge natürlich weg. 

Aggregation model - del.icio.us erlaubt jedem Nutzer, für jede Ressource eine eigene 
Tag-Gruppe anzulegen und zu pflegen. Es erlaubt also mehrere Tag-Gruppen pro Ressource, 
genauer, so viele Tag-Gruppen, wie Nutzer die Ressource in ihre Sammlung aufgenommen 
haben. 

Object type - Prinzipiell kann jedes Dokument, dass per HTTP erreichbar ist, in del.i- 
cio.us aufgenommen werden. Es gibt keinerlei Einschränkungen nach Inhalt oder Form des 
Dokuments. 

Source of material - Wie aus dem obigen Absatz deutlich wird, kann in del.icio.us jedes 
beliebige Dokument getaggt werden, so lange es per HTTP erreichbar ist. Dabei spielt es aus 
Sicht von del.icio.us keine Rolle, wer der Urheber der Ressource ist. 

Resource Connectivity - Um Vorschläge für Tags zu machen, stellt del.icio.us lediglich 
Verbindungen zwischen den Tag-Gruppen her, mit denen eine Ressource bereits getaggt 
wurde, nicht aber über mehrere Ressourcen hinweg. 

Social Connectivity - del.icio.us erlaubt es Nutzern, sich gegenseitig zu beobachten und 
Netzwerke zu bilden. 

b Der Taggingprozess 

Grundsätzlich gibt es drei Möglichkeiten, seiner del.icio.us-Sammlung eine Ressource hin- 
zufügen: über die del.icio.us-Website direkt, über das von del.icio.us bereitgestellte Book- 
marklet^^ sowie über externe Applikationen. Im Folgenden werden vor allem die beiden ers- 
ten Möglichkeiten betrachtet, wobei der Prozess an sich der gleiche ist; lediglich der Aus- 
gangspunkt ändert sich. 



42 Ein Bookmarklet ist eine Javascript- Anweisung, die man wie einen Bookmark ablegen und bei Bedarf aktivieren 
kann. Zumeist werden Bookmarklets dazu eingesetzt, die gerade im Browser aktive Seite zu verarbeiten, 
weiterzuleiten oder umzugestalten. 
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Benutzt man das Bookmarklet von del.icio.us, so kann man, in dem man es aufruft, die 
gerade im Browser geladene Seite zu del.icio.us weiterleiten und taggen. Nutzt man direkt 
die del.icio.us-Seite, muss man die URL der Webseite selbst in das Formular eingeben. Dar- 
überhinaus übernimmt das Bookmarklet auch den Titel der Seite, den man bei dem Weg 
über das URL-Formular selbst eingeben muss. Für aktive del.icio.us-Nutzer ist das Bookmar- 
klet auf jeden Fall das Mittel der Wahl. 



H 



del.icio.us / itst / 



by Sascha A. Carlin populär | recent 



your bookmarks | your network | inbox | links for you | post logged in as itst_ | settings | logout | help 



url I http ://vwvw. cite u I i ke . o rg/ 



ciescription [Cit eULike: Afree online seiviceto organiseyauracademicpapers | 

notes 



tags I Space separated 



T your tags s- sort: alphabetically | byfrequency 

1997 1999 @ezzy adsense advertising aggregator ajax algorithm alternativbanner 

anzeigen aol, api architecture article atom attention audio automatic bad banners bbc beliebtheit benchmark 
best-practice betty bionic black-websites blackhat blog blogging book bookmarking broad broken-glass browser cameras 
catalogue chart citeulike class Classification collaboration collaborative-filtehng columns Comics Community Conferences 
content context cost criticism css cyberpunk data datamining defacement definition del.icio.us design development 
discovery discussion doppelklicker drupal dublincore ecologist economics eie email enterprise entscheidungen equal 
event expehence expenment extension extensions extraction eyetracking facets feeds filter findability firefox flash flickr 
folk folksonomy football forms forrester forum fotos framework freeware frequency fhendster game games generator 
qeotaqqinq qermany qooqle+base qroup handbuch heiqht history ia ihm id identity, ie Implementation in:qooqle 

Abbildung 5-1: Ausschnitt aus dem Tagging-Formular von del.icio.us. 



Die im Browser geladene Webseite hat die URL http://www.citeulike.org/. Durch einen 
Klick auf das del.icio.us-Bookmarklet gelangt man zu diesem Formular, in dem URL und Ti- 
tel der Seite bereits eingetragen sind. Nun hat man die Möglichkeit eine Notiz zu diesem 
Bookmark anzulegen sowie Tags zu vergeben. Zu sehen sind auch alle eigenen Tags, die 
man per Mausklick dem neuen Bookmark zuordnen kann. Desweiteren kann man Tags auch 
direkt in das Eingabefeld eingeben. 

Bis zum 24.07.2006 zeigte del.icio.us in diesem Formular auch Tags an, die als „recom- 
mended tags" gekennzeichnet waren. Dieses Feature ist im Moment aber nicht aktiviert. Im 
HTML-Quellcode des Formulars sind die entsprechenden Angaben zwar enthalten, sie wer- 
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den aber nicht angezeigt. Wie es scheint, liegt ein technisches Problem vor. Leider gibt es von 
del.icio.us oder Yahoo! Inc. keine Informationen dazu. 

Die vorgeschlagenen Tags werden aus den Tag-Gruppen extrahiert, die bereits für die 
URL angelegt wurden. Der exakte Algorithmus ist leider nicht öffentlich dokumentiert, nach 
meinen Beobachtungen aber werden die 10-15 am häufigsten benutzten Tags dort angezeigt. 

Beginnt man nun damit, Eingaben und das Feld „tags" zu machen, zeigt del.icio.us direkt 
diejenigen eigenen Tags an, die mit den gleichen Zeichen beginnen wie die bereits eingege- 
benen: 



^ 



del.icio.us / itst / 



by Sascha A. Carlin 



your bookmarks | your network | inbox | links for you | post 



populär I recent 
logged in as itst_ | settings | logout | help 



url http://www.citeulike.org/ 



ciescription CiteULike: Atree online serv/ice to organise your academic papers 
notes 



tags |c 
suggestions 
save I 



Space separated 



criticism collaborative-filtering collaboration Community css catalogue citeulike Comics 



s- sort: alphabetically I byfrequency 



T your tags 

1997 1999 @ezzy adsense advertising aggregator ajax algorithm alternativbanner 

anzeigen aol, api architecture articie atom attention audio automatic bad banners bbc beliebtheit benchmark 
best-practice betty bionic black-websites blackhat blog blogging book bookmarking broad broken-glass browser cameras 
catalogue chart citeulike class Classification collaboration collaborative-filtering columns Comics Community Conferences 
content context cost criticism css cyberpunk data datamining defacement definition del.icio.us design development 
discovery discussion doppelklicker drupal dublincore ecologist economics eie email enterprise entscheidungen equal 
Abbildung 5-2: Type-Ahead-Funktion bei del.icio.us. 



Hat man die Tags eingegeben und das Formular abgeschickt, leitet del.icio.us den Nutzer 
wieder zur gerade getaggten Webseite zurück, um ihm so die Möglichkeit zu geben, ohne 
lange Unterbrechung weiter zu surfen. 
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c Navigation in del.icio.us 

Der Einstieg in del.icio.us erfolgt meist über die eigene Linksammlung, zu erreichen unter 
der URL http://del.icio.us/[Benutzername]/. Von dort aus kann man seine eigenen Book- 
marks verwalten und in die gesamte Linksammlung aller del.icio.us-Nutzer einsteigen. 



^ 



del.icio.us / itst / 



by Sascha A. Carlin 



your bookmarks | your network | inbox | links for you j post 



populär I recent 
logged in as itst_ | settings | logout | help 







All your items (266) 




1 del.icio.us -^1 search 









« earlier | later 3> page 1 of 27 

CiteULike: A free online Service to or ganise your academic papers edit/deiete 

to citeulike tagging literatun/enA/altung libraiy ... ^^^^^^^^^^^^^B ■■' ^ ^^^ ^^° 

jarkoiicious :: triSexuality Standard edit/deiete 

to Wordpress theme ... saved by 44 other people ... on aug 9 



ISWC-folksonomy.pdf (application/pdf-Objekt) edit/deiete 

to folksonomy tagging toread research paper maths ... saved by 21 other people 



. on aug 9 



Tagground - The social bookmarking mashup. edit/deiete 

discovertags uses for a Site - discover Sites tagged with [tag], ifthere was an api orfeed, we could 
e}{tractthetags usedfora Site and displaythemforthe users'convinience in a tagging Interface. 
"Tagground searches various social web applicati 
to tagging search discovery ... saved by 59 other people ... on aug 9 

Erste AOL-Kundin anhand Suchanfragen eindeutig identifiziert atWWWorker- 
Abbildung 5-3: Ansicht der eigenen Linksammlung in del.icio.us. 



1 tags 

1 1997 
1 1999 
^ezzy 

adsense 

advertising 

aggregator 

ajax 
1 algorithm 
1 alternativbanner 
1 anzeigen 
1 aol. 
3 api 

3 architecture 
23 articie 
1 atom 
1 attention 



▼ 


options 


3> 
3> 


view as cloud | list 
sort by alpha | freq 
show 1 hide bundles 


3> 


use minimum: 1 . 2, 5 


3> 
3> 


arrange tags 
edit tags 



Abbildung 5-4: Optionen zur Dar- 
stellung der eigenen Tags. 



Links zu sehen die letzten Bookmarks, rechts die Liste al- 
ler Tags, die man bereits benutzt hat. Über die Optionen 
kann man die Darstellung der Tags steuern und sie editieren. 

• tags articie best-practice So kann man die Tags 

bookmarking Classification nach dem Alphabet ord- 

collaboration collaborative-fiftering 

C r iti C i S m def inltlon del.icio.us nen oder sie als Tag 

design diSCUSSion drupal flickr 

folksonomy ia llbrary paper php Cloud anzeigen lassen. Der Screenshot in Abbildung 5-5 

phpbb research social Software 

tagclouds taggjng taghell tags zeigt die eigenen Tags in einer Tag Cloud, wobei nur die 

taxonomy theme toread ^ ^.^ ^^^ mindestens fünf Mal benutzt hat, angezeigt 

VISUallZatlOn wlklpedla ^ ' ö ö 

Abbildung 5-5: Darstellung der eigenen werden. 
Tags als Tag Cloud. Angezeigt werden nur 
Tags, die mindestens fünf Mal benutzt 
wurden. 
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Wählt man aus der Liste nun ein Tag aus (im Beispiel hier „discussion"), so werden einem 
alle Ressourcen angezeigt, die mit diesem Tag versehen wurden. Außerdem erhält man eine 
Übersicht über die verwandten Tags, also jene, die man gemeinsam mit dem gewählten Tag 
benutzt hat. 







search 


Your itsms taggecj discussion -^ view all, populär, recommendations 


1 del.icio.us 


d 





. earlier | later . page 1 of 2 , related tags t tags 

Civ6i4.pdf (application/pdf-Objekt) 8dlt/d8l8t8 5 +article 23 articie 

to tagging folksonomyartlcl8 discussion crlticism ... sav8CJ by1 1 + bookmarking 6 best-practice 

oth8rp8rson ...onaug2 1 + Classification 8 bookmarking 

2 + collaboration 12 Classification 

taxocop » Social tagging cdlt/dslsts 2 + collaborativ8-filt8ring 5 collaboration 

to tagging enterprise discussion ... saved by 25 otherpeople ... on 2 + criticism 9 collaborative-filtering 

aug 2 1 +d8l.icio.us 12 criticism 
Abbildung 5-6: Ausschnitt aus der Ansicht der eigenen mit "discussion" getaggten Ressourcen. 



Aus der Liste der „related tags" kann man nun ein weiteres Tag (hier: „collaboration") 
auswählen und entweder zu den Ressourcen wechseln, die man mit ihm getaggt hat, oder 
man wählt das Plus-Zeichen vor dem Tag aus und erhält so eine Übersicht über die man mit 
„discussion" und „collaboration" getaggt hat. Wie bereits zu sehen ist, gibt es zwei Ressour- 
cen, auf die das zutrifft. 



Your items tagged discussion+collaboration — * view all 1 del.icio.us ^A search 



■£ oarlier j later 3- showing both itoms related taas taas 

Search 2.0 VSTraditional Search. Part 2 edit/delete 2 + collaborative-filtering 23 arlicle 

to search-engines discussion collaboration collaborative-filtering ^ best-practice 

review@ezzy... saved by 37 otherpeople ...onjuly 26 '^ remove discussion 8 bookmarking 

s remove collaboration 12 Classification 

Search 2.0 VSTraditional Search Part One edit/deiete 5 collaboration 

to search-engines discussion collaboration collaborative-filtering 9 collaborative-filtering 

revievv'@ezzy... saved by 444 otherpeople ... onjuly 26 12 criticism 
Abbildung 5-7: Ansicht der mit "discussion" und "collaboration" getaggten eigenen Ressourcen. 



Über die beiden „remove''-Links kann man einzelne Tags aus dem Filter entfernen. Um 
nun zu sehen, welche Ressourcen andere Nutzer mit „discussion" und „collaboration" ge- 
taggt haben, wählt man in der Kopfzeile den Link „all". In der nun angezeigten Liste findet 
man neben jeder Ressource einen Link „save this", um diese Ressource seiner eigenen Samm- 
lung hinzu zu fügen. 
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HowTo AskQuestionsThe Smart Way savethis 

In the World of hackers, the kind of answers you getto yourtechnical questions depends as much on the wayyou askthe questions as 

on the dlfflculty of developing the answer. This gulde will teach you howto ask questions In a way more llkely togetyou 

by curre ntlyeddle to advice buslness chaos collaboratlon connnnunity cool cult culture discusslon educatlon ... ^^^^^^^^^| 
^^|... on july 21 

i d e a nt: Facilitatingthe social annotation and commentarvof web pages savethis 

theoretlcal framework by Ullses A. Mejias on distributed textual discourse. Something l'm Interested in 

by sharonhenson to distributed textual discourse discusslon annotation social collaboratlon tags tagging wiki ... saved by 46 other 

people ... on july 1S 

Abbildung 5-8: Ausschnitt aus der Liste aller mit "discussion" und "collaboration" getaggten Ressourcen. 



Rot hinterlegt sieht man in der Darstellung die Anzahl der Personen, die diese Ressourcen 
bereits getaggt und ihrer Linksammlung hinzugefügt haben. Möchte man nun die Ressource 
„How To Ask Questions The Smart Way'' in seine Sammlung aufnehmen, wählt man „save 
this'' (rechts neben dem Titel) und gelangt zum Tagging-Formular: 



url I http ://www. catb . o rg/"^ e s rAaq s/s m art-q u e sti o n s . htm I 



descriptlon HowTo Ask Questions The Smart Way 
notes 



tags Space separated 



T currentlyeddie's tags 

advice buslness chaos collaboration Community cool cult culture discussion education 

▼ V^'J'' tags s- sort: alphabetically j by frequency 

1997 1999 @ezzy adsense advertising aggregator ajax algorithm alternativbanner 

anzeigen aol, api architecture articie atom attention audio automatic bad banners bbc beliebtheit benchmark 
best-practice betty bionic black-websites blackhat blog blogging book bookmarking broad broken-glass browser cameras 

Abbildung 5-9: Ausschnitt aus dem Tagging-Formular mit den Tags, die von einem anderen Nutzer für diese Ressource 

vergeben wurden.. 



Nun werden neben den eigenen bereits genutzten Tags auch die Tags angezeigt, die 
„currentlyeddle" benutzt hat, um diese Ressourcen zu taggen. „currentlyeddle" ist der Nut- 
zer, der diese Ressource zuletzt seiner Linksammlung hinzufügte, wie in Abbildung 5-8 zu 
erkennen. 

Bisher haben wir uns nur in der eigenen Linksammlung sowie in einem globalen „Tag- 
Raum" umgesehen. Auf die Art neue, interessante Ressourcen zu entdecken kostet viel Zeit 
und ist nicht praktikabel. 
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del.icio.us bietet jedoch einen Ausweg in Form von „subscriptions''. Diese können über 
ein einfaches Formular angelegt und verändert werden: 



del.icio.us / settings / itst_ / inbox 

your bookmarks | your network | inbox | links for you | post 



populär I recent 
logged in as itst_ | settings | logout | help 



subscribeto atag 

tag 

onlyfromthis user f 



;ieave blank for all 



subscribe 



inbox name subscription 

Coll-Filtering Vcollaborative-filtering » editlabel » delete subscription 
Folksonomy Vfolksonomies » edit label » delete subscription 

Folksonomy */folksonomy » edit label » delete subscription 

Tagging Vtagging » edit label » delete subscnption 

Technosocial Vtechnosocial » edit label » delete subscription 

Abbildung 5-10: Die Benutzeroberfläche zum Anlegen und Editieren von Abonnements. 



settings 

s profile 

3> subscriptions 

3> tags 

3* antisocial 

3- Import 

» export 

ex p eh mental 

3- tag bundles 

» daily blog posting 

» license 

3> private saving 

3> network 



your subs 

Coll-Filtering 
7collaborative-filtering X 

Folksonomy 
*/folksonomies X 
*/folksonomy X 

Tagging 
7tagging X 

Technosocial 
7technosocial X 

» edit inbox 

Abbildung 5-11: Darstellung der 
Abonnements in der "inbox". 
Abonnements mit dem gleichen 
"inbox name " werden in einer m 
"Ordner" zus ammenge fas st. 



Diese Abonnements laufen nun in der „inbox" (dritter Link 
von rechts in der zweiten Zeile) zusammen und können dort 
auf einen Blick betrachtet werden. Zu beachten ist die Funktion 
des „inbox name''. Die beiden Abonnements „*^/folksonomies'' 
und „*^/folksonomy'' (Der Stern zeigt an, dass diese Abonne- 
ments alle Ressourcen mit diesen Tags umfassen, gleich welcher 
Benutzer sie getaggt hat. Wollte man nur die Ressourcen eines 
bestimmten Benutzers abonnieren, würde dies so aussehen: 
„[Benutzername]/[Tag]".) haben beide den gleichen „inbox 
name''. Sie erscheinen in der „inbox" gemeinsam. 

Darüber hinaus kann man auch einen Benutzer beobachten 
und so regelmäßig sehen, welche Ressourcen er neu getaggt hat. 
del.icio.us nennt dieses Feature „network". 
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■£ earlier | later s- 

The emergence of on-line Community savethis 

Baym, Nancy (1 998). The emergence of on-line Community, in Steven G. Jones (Ed.), Cybersociety 
2.0: Revisiting computer-mediated communication and Community (pp. 35-68). Thousand Oaks, 
CA: Sage, 
by wcrosbie to Nancy_Baym on-iine_community ... 7 hours ago 

A Virtual Barbeque: A Corpus Linguistics Approach to Studying an Emergent 
Community savetiiis 

Roz Horton &. Richard Oiordano. References inciude Shanl< 0., (1 993, Ivlarch 22) "Abductive 
muitiioguing: the semiotic dynamics of navigating the nef in The Arachnet Electronic Journal on 
Virtual Culture 1 (1). 
by wcrosbie to Richard_Giordano Roz_Horton semiotic_dynamics ... 7 hours ago 

Abbildung 5-12: Ausschnitt aus der Darstellung des "network" eines Nutzers. 





Vour network (4) 

rabourn x 
Sulpicus X 
wcrosbie x 
yish X 




Qdd 


3> n 


etwork settings 



1^^ New Linksi LtJ- eRONA: Meine Feeds üi Blog - Komm 

Q HP Research paper on tagging 

Q digg / Technology 

In diesem (siehe Abbildung 5-12) Netzwerk sind u The wisdom of crowds - wikjpedia, the free e. . . 

Q The Great Flickr Tools Collection 

die neu eetaeeten Ressourcen der Benutzer „rabourn", r-. , , , 

^ ^^ [J blogoforum 

„Sulpicus", „wcrosbie" und „yish" ZUSammengef aSSt. D FindabÜlty wlth tags: Facets, Clusters, and piv. . . 

|_j Pageflakes - The whole Web at your Fingertips! 

Q 5pout - movies 

LJ x# - scripture networkjng 

l_j Consumating 

|_J Dandelife.com - A 5ocial Biography Network, j. . . 

Q BlinkList - The 5marter Way to 5urf the Internet! 

lj Royalty Free 5tock Photos at Fotolia.com 

neuesten Ressourcen per RSS-Feed abzurufen und ent- ^ the eiectric sheep screen-saver 

LI Platial.com 

|_j Bokardo s- The Del.icio.us Lesson 

marks" genannt") oder mittels einem Feed-Reader zu Q styiehive - social bookniarkjng for the product. . . 

Q Tagging Files in Spotlight, made easier. at Liq. . . 

|_J microformats 

zeigt wird, kann so „exportiert" und auf anderen Web- u Fllckr: Tags in the My cassette collection Pool 

Q Phlat research paper 



Eines der interessantesten Features von del.icio.us 
ist aber die Möglichkeit, für nahezu alle möglichen 
Kombinationen von Benutzern und Tags die jeweils 



weder direkt im Browser (bei Firefox „Live-Book- 
marks" genannt") oder mittels einem Feed-Reader 
lesen. Jede Seite, auf der eine Liste Ressourcen ange- 
zeigt wird, kann so „exportiert" und auf anderer 
Seiten oder in Feed-Readern dargestellt werden. 



Eine der vielen Anwendungsmöglichkeiten ist die 
Kombination der Feeds mit der im Abschnitt Filtern 
statt suchen, S. 73f, erwähnten Gruppentags. Hat sich 
eine Gruppe auf ein bestimmtes Tag geeinigt, das sie 
benutzen will, um alle Mitglieder der Gruppe stets 

über neue Ressourcen zu informieren, kann man die so 

Abbildung 5-13: Ansicht des RSS-Feeds einer 
getaggten Ressourcen auf einer externen Webseite zu- "inbox" im Browser Firefox. 



Q PHLAT - Intuitive Personal 5earch 

[j Google Base 

|_j Hungry ? Get f ood now - check www . gophern . . . 

Q Front Page | Pixel Groovy 

|_J Beagle doesn't index the extra fields in ID3v2 

|_j Google Code - Project Hosting 

|_J FindabÜlty with tags: Facets, Clusters, and piv.. 

Q Lyrics3 

LJ adaptiveblue home 

|_j Code 5nippets: Store, sort and share source . . 
in Tabs öffnen 



sammenfassen. del.icio.us sorgt dafür, dass der Feed regelmäßig aktualisiert wird. 
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6 Tagging als Chance 
a Informationsflut 

Die Entwicklung des World Wide Web und der Möglichkeiten des Auffindens relevanter 
und interessanter Ressourcen zeigt, dass sowohl Kataloge wie Volltextsuchmaschinen nur 
zum Teil in der Lage sind, mit dem exponentiellen Wachstum des Webs, dass heißt der Web- 
sites und deren Inhalten, Schritt zu halten. Kataloge sind aus dem Suchprozess der meisten 
Nutzer vollständig verschwunden - zumeist werden Volltextsuchmaschinen angefragt, in 
Deutschland vor allem Google. Laut den Daten von Webhits^^ ü^gt dabei Google mit 86% 
Prozent aller Suchanfragen an Platz eins. Der erste Katalog, AllesKlar, taucht auf Platz neun 
auf mit lediglich 0,3%. Der DMOZ-Katalog, einer der früher führenden Kataloge, belegt le- 
diglich Platz 14 mit 0,1% der Suchanfragen. In den USA erreichen Google, Yahoo und MSN 
gemeinsam ebenfalls 86%^^ und lassen damit andere Suchmaschinen und Kataloge weit hin- 
ter sich. 



T 



Suche . 



:il 



7- Tage-News 
News- Archiv 
News unterwegs 
Newsletter 
News einbinden 

Telefontanfe 
Intemettarife 
Intemetstörnngen 

Software 
rr-Markt 
heisetreff 

Leserforum 
English Pages 

Abo & Heft 
Veranstaltungen 
Kontakt 
Mediadaten 



10.08.2006 11:27 © 

« Vorige I Nächste » [" 

Hollywood sorgt für Gewinne bei News 
Corp. 



News suchen 



los! 



Hilfe 



Aus ATI wird AMD 



T op-Meldungen 



Micro soft-Patchday: Zwölf 

Rupert Murdochs News Corporation hat im abgelaufenen Quartal Updates für 23 Lücken 

852 Millionen US-Dollar (664 Millionen Euro) verdient und damit 

19 Prozent mehr als die 717 Millionen US-Dollar (559 Millionen 

Euro) im Vergleichs quartal des Vorjahres. Die News Corp. WWDC: Der Power Mac 

erwirtschaftete in diesem letzten Quartal des Geschäftsjahres einen ^^^ (ier Mac Pro kormnt 

Umsatz 6,78 MlHarden US-DoUar (5,28 MlHarden Euro), 1 1 ^^ ^^'^ 

Prozent mehr als im Vorjahr. Der Gewinn pro Aktie stieg von 0,19 LXW-Maut: Von der Maut. 

auf 0,24 US-DoUar (0,18 Euro). Das Ergebnis Hegt damit m den 

Erwartungen der Analysten. 



^ Weilere Irfös zu Intel 

^^ vPro Fernverwaitungatöcfinologie auf 



^)hsu« 



y/Jj/Jö 



Akttielle Meldungen 



Hollywood sorgt für 
Gewinne bei News Corp. 

Medion schrumpft 



Abbildung 6-1: Screenshot eines Artikel von heise.de. Neben dem eigentlichen Inhalt in der Mitte indexieren Volltext- 
suchmaschinen auch die Inhalte rechts und links davon. 



43 Siehe http://www.webhits.de/deutsch/index.shtml7/deutsch/webstats.html - Zugegriffen am 10.08.2006. Stand vom 
10.08.2006. 

44 Siehe http://www.comscore.com/press/release.asp?press=935 - Zugegriffen am 10.08.2006. Stand vom 18.07.2006. 
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Volltextsuchmaschinen im World Wide Web haben allerdings gegenüber Textdatenban- 
ken wie denen von Genios und anderen Informationsdiensten den Nachteil, über wesentlich 
weniger Suchoperatoren zu verfügen. Zwar beherrscht der Marktführer Google boolesche 
Operatoren und Synonymsuche, aber es lässt sich beispielsweise nicht nach Begriffen suchen, 
die im gleichen Satz oder Abschnitt vorkommen. Auch indexieren Google, Yahoo und MSN 
die gesamte Seite, inklusive aller Daten, die zum Layout und der Navigation einer Site gehö- 
ren, anstatt nur den eigentlichen Inhalt der Seite zu indexieren. 



^^.^^ — Web Bilder Groups News Froocile Mehr » 

tj/ji(')Q|P |software heisetreff "it markt " site:heise.de Suche | 

O Suche: <^ Das Web <^ Seiten auf Deutsch <^ Seitens 



WGb Ergebnisse 1 - 100 von 4.320.000 Seiten auf Deutsch aus heise.de für Software heisetreff "it markt " . (0,10 Sekunden) 
Abbildung 6-2: Google findet für die angegebenen Suchbegriffe, die aus der Navigation von heise.de stammen, über 
vier Millionen Treffer allein aufheise.de selbst. 



Volltextsuchmaschinen müssen, wenn sie auf Dauer im World Wide Web bestehen wol- 
len, nicht nur ihre Suchalgorithmen ständig verbessern, sondern auch Wege finden, irrele- 
vante Informationen aufzufiltern. 

b Filtern statt suchen 

Taggingsysteme verfolgen einen anderen Ansatz. Statt Volltextsuchen bieten sie Zugriff 
auf Informationen, die von Menschen indexiert, getaggt, wurden. Wie gezeigt wurde, ermög- 
lichen sie es so, relevante Inhalte zu entdecken und diejenigen Inhalte herauszufiltern, die für 
den Suchenden von Interesse sind. Wenn die ersten Ansätze zu Collaborative Filtering in 
Taggingsystemen weiter ausgebaut werden, bieten sich hier interessante Möglichkeiten, sehr 
einfach und schnell Inhalte zu entdecken, auf die man sonst wahrscheinlich nicht gestoßen 
wäre. Kein einzelner Mensch hat die Ressourcen oder die Möglichkeit, aus den über acht 
Milliarden Webseiten diejenigen herauszufinden, die für ihn interessant wären. Doch durch 
die Masse an Menschen, die Taggingsysteme wie del.icio.us benutzt, hat er die Möglichkeit, 
auf das Wissen - dass heißt auf die Informationen, die alle Nutzer gemeinsam eingegeben 
haben - aller zuzugreifen. 
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Dienste wie del.icio.us bieten kleineren Gruppen von Menschen die Möglichkeit, sich ge- 
genseitig auf interessante Informationen aufmerksam zu machen. Beispielsweise durch die 
Benutzung eines speziellen Gruppentags erhält man einen Gesamtüberblick über alle Res- 
sourcen einer Gruppe. Durch Kombinierung des Gruppentags mit anderen Tags filtert man 
so das Suchergebnis immer weiter, bis man schließlich diejenigen Ressourcen entdeckt hat, 
die im Moment relevant sind. 
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7 Ausblick 

a Kombination von VoUtextsuchmaschinen und Tagging 

Mit dem Kauf von del.icio.us und Flickr hat Yahoo gezeigt, dass man dort an diese Syste- 
me glaubt. Yahoo möchte die del.icio.us-Plattform schnellstmöglich in das eigene Produkt 
My Web2 integrieren. Damit könnten Yahoo-Nutzer beide Welten, die der VoUtextsuchma- 
schinen und der Taggingsysteme, parallel und gemeinsam nutzen. Sucht man eine spezielle 
Information, nutzt man die VoUtextsuchmaschinen. Möchte man weitere Inhalte entdecken, 
nutzt man die Tags und die Folksonomy. 



"XSHoOf, Suche 



Willkonrirmenj itst_cca 
r Abmelderi j Mein Account l 



D^UTJäCHLÄhrB 
In Mein Web Speichern meine gespeicherten Seiten anzeigen 

URL: http://www.phpbb.cJe/viewtopic.php?p=1 66246 



Titel: |XML Daten auslesen? :: phpBB.de -Aktuelle Version: pf 

Text: 



Tags: 






1 




* Trennen Sie mehrere Tags mit Kommas 





Zugriff: C Nur ich 

O Nur diese Kontakte... 
® Alle 

|7Eine Kopie dieser Seite abspeichern. 



Speichern | Abbrechen 



Abbildung 7-1: Eine mittels der Volltextsuche gefundene Ressource kann der Nutzer in seinem "Mein Web" able- 
gen und dazu Tags vergeben. 
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Über seine eigenen Tags gelangt der Nutzer zu allen Ressourcen, die ebenfalls mit diesem 
Tag getaggt wurden. Hier hat er die Möglichkeit, tiefer in die Ergebnisse einzusteigen und 
weitere Inhalte zu entdecken. 



Seiten Tags Kontakte 

Ansicht 

Meine Seiten 

Seiten meiner Kontakte 

Alle Seiten 



Tags 

Qtags 



Leeren fxl 



Ähnliche Tags: 

O importecj del... (8) 
O social (7) 
O bookmark (5) 
O bookmarking (5) 
O folksonomy (5) 
O search [6) 
Otaa (5) 
O tagginc] (5) 
O web (5) 
O webZO (5) 

mehr... 

Abbildung 7-2: Ausgehend von einem selbst vergebenen Tag (hier 
"tags") gelangt der Nutzer zu einer Liste aller damit getaggten Res- 
sourcen und hat die Möglichkeit, "tags" mit weiteren Tags zu kom- 
binieren und damit die Ressourcen weiter zu filtern. 



In Abbildung 7-3 ist der Nutzer, ausgehend von „tags'', tiefer in die getaggten Ressourcen 
eingestiegen und hat „tags'' zunächst mit „folksonomy" und schließlich mit „web2.0" kombi- 
niert, um die Trefferliste zu filtern. 
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Alle Seiten > tags > folksonomy > web2.0 



Seiten 1 - 20 von ungefähr 110 

Abbildung 7-3: Durch Filterung nach weiteren Tags hat sich die Treffermenge auf 110 redu- 
ziert. 



b Tagging im Unternehmen 

IBM hat mit Dogea/^ in einer Eigenentwicklung nicht nur das Prinzip von del.icio.us 
übernommen, sondern es mit Erweiterungen versehen, die in einem großen Konzern not- 
wendig und sinnvoll sind. So kann der Nutzer nicht nur Anmerkungen zu seinen Ressourcen 
hinzufügen, sondern er kann auch per „ Alerts" auf Inhalte aufmerksam gemacht werden, die 
in seiner Interessensphäre liegen. Dogear bietet auch Ansätze von Collaborative Filtering, um 
Nutzer auf Inhalte aufmerksam zu machen: 



DoQ-ear 



collaborative filtering techniques to screen new 



bookmarks for those that are predictably of int er est to an individual (or 
a group of individuals). Common interests can be inferred based on a 
number ofobservable user actions, including use ofsimilar tags and/or 
tag combinations, similarity of bookmark (URL) collections, common 
RSS subscriptions, and dick streams that indicate interest in specific 
kinds of bookmarks. Text analvsis of bookmark titles, descriptions, and 



kinds of bookmarks. Text analysis of bookmark titles, descriptions, and 
comments will also be used to determine bookmark relatedness. E-mail 
notification, System tray Status indicators, or small pop-up Windows can 
alert users to new information. 



Dogear wertet dabei nicht nur die von einem Benutzer vergebenen Tags aus, sondern be- 
trachtet auch die Verbindungen zwischen Benutzern und Ressourcen sowie die abonnierten 
Feeds und die angeklickten Bookmarks. 



45 Siehe http://domino.research Jbmxom/comm/wwwr_thinkresearch.nsf/pages/20060627_dogear.html - Zugegriffen 
am 10.08.2006. 
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IBM wird Dogear, das momentan im Intranet von IBM läuft, in die kommende Version 
von Lotus Notes, Hannover, integrieren^^ und damit die Idee des Taggens in all die Unter- 
nehmen tragen, die Lotus Notes einsetzen. Weltweit sind dies 60.000 Unternehmen mit ins- 
gesamt 120 Millionen Nutzern^^. 

c Amazon Tags 

Amazon bietet auf seiner US-amerikanischen Website Nutzern die Möglichkeit, Produkte 
zu taggen und davon ausgehend, weitere Produkte zu entdecken. Dieses Feature steht paral- 
lel zu den Empfehlungen und den Wunschzetteln, die Amazon darüber hinaus anbietet. Eine 
Integration aller drei Systeme wird angestrebt und könnte die Empfehlungen, die momentan 
auf tatsächlich getätigten Käufen basiert, verbessernd^: 



You might want to tag items you \e purchased in the past. This allows you 
to organize your collection in any way you wish. You can also use tags to 
help you remember items your're considering for purchase, e.g. ifyou are 
planning to buy a digital camera, you might tag several makes and modeis 
so that you can look at them side by side, organized the way you wish. 
Don Y like the way Amazon has organized its science fiction or cookbooks? 
Tag the items you care about with the categories that matter to you. 
Because people 's tags are (by default) visible to others, a great side effect 
of tagging is that you can navigate among items through other people 's 
tags. What items have people tagged ''gift" or ''Tuscany" or ''robot?" 



d Aus Folksonomies hierarchische Strukturen bilden 

Heymann und Garcia-Molina (vgl. [Heymann2006]) schlagen eine Methode vor, um eine 
flache Folksonomy in eine Hierarchie umzuwandeln. Sie gehen dabei von einem triparaten 



46 Siehe http://www.computerwoche.de/produkte_technik/software/576713/ - Zugegriffen am 10.08.2006. Stand 
24.05.2006. 

47 Telefonische Information der deutschen IBM-Pressestelle vom 10.08.2006. 

48 Siehe forums.prosperotechnologies.com/am-custreview/messages?msg= 19295.1 -Zugegriffen am 10.08.2006. 
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Graphen aus und betrachten die Häufigkeit, mit der ein Tag vorkommt und die weiteren 
Tags, die häufig mit diesem Tag vorkommen. 
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politics 




activism 



economics 



government 



law 



environment 



finance 



money 



Abbildung 7-4: Ausschnitt aus einer Tag-Hierarchie, ersteUt nach der Methode von Heymann und Garcia- 
Molina. 



Diese Ähnlichkeiten überführen sie in einen ungewichteten Graphen und kappen dabei 
diejenigen Verbindungen zwischen zwei Tags, bei denen die Ähnlichkeit unter einem gesetz- 
ten Schwellenwert liegt. Nun bewegen sie sich durch diesen Graphen und fügen Tag für Tag 
zu einem neuen Graphen hinzu. Dabei ordnen sie jedes Tag jeweils demjenigen Tag unter, 
mit dem es die meiste Ähnlichkeit hat. Hat ein Tag eine kleinere Ähnlichkeit mit allen bereits 
im Graph vorhandenen Tags, wird es der Wurzel des Graphen untergeordnet; es ist schein- 
bar ein neuer übergeordnetes Tag. 



Heymann und Garcia-Molina stellen fest, dass ihre Methode umso besser funktioniert, je 
größer die zugrunde liegende Folksonomy ist. Sie prüften ihren Algorithmus anhand von 
Daten aus del.icio.us und CiteULike und bemerken dazu: 
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With respect to most of these features, the CiteULike data turns out to be 
more difficult to turn into a hierarchy: it has low density (some users do not 
tag objects at all), low overlap between users (academics working in diffe- 
rent fields), and a specißcity distribution which is very highly geared 
towards detailed tags. By contrast, Delicious is high density, high overlap, 
and has a much more even specißcity distribution. While different algo- 
rithms might be better tunedfor different specißcity distributions, low den- 
sity and overlap make it generally more difficult to create a hierarchy from 
tagging data (these factors mean that our algorithm needs a larger sample 



datasetfrom CiteULike than from Delicious to be effective). 



Tof) Leval ConrisdiDn 



X. 




i »^4 ^fi •4 



Tof^ Lqvi^I Conn^diDn 



Edge 



4 d^ 



fa) Similarity fb) Latent Hierarchical TrLXOiiomy 

< lr(i]i:] 
Abbildung 7-5: Die beiden Graphen, die Heymann und Garcia-Molina nutzen, um aus einer Folksonomy eine Hierar- 
chie zu generieren. Rechts der ungewichtete Ahnlickeitsgraph, links die sich ergebende Hierarchie. 

e Tag-Cluster 

Begelman, Keller und Smadja (vgl. [Begelman2006]) verfolgen einen anderen Ansatz. Sie 
versuchen Tag-Cluster zu bilden und beschreiben dazu eine Vorgehensweise, die von der 
Häufigkeit ausgeht, mit der ein Tag a mit einem anderen Tag b in derselben Tag-Gruppe vor- 
kommt. Anhand von Daten von del.icio.us identifizierten sie aus einer Auswahl von Tag- 
Gruppen 1100 Tag- Verbindungen, der sie jeweils eine Häufigkeit zuordneten. 



Sie überführen nun diese Datentabellen in einen Funktionsgraphen und bilden die erste 
und die zweite Ableitung der Funktion. Sie suchen nun, beginnend am Endes des Graphen, 
nach dem Punkt, an dem die erste Ableitung ein lokales Maximum erreicht bzw. die zweite 
Ableitung vom Positiven ins Negative übergeht. An diesem Punkt bestimmen sie den „cut- 
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Abbildung 7-6: "Co-Tags" von "rss" und die Häufigkeit, mit der diese 
Tags gemeinsam mit "rss" in einer Tag-Gruppe vorkommen. 

off": alle Tags rechts davon werden als nicht verwandt genug verworfen, die übrigen links 
davon als stark verwandt angesehen. Dabei bemerken sie, dass der einzige zu optimierende 
Parameter das „minimal peak high" ist. Läge dieser Wert zu niedrig, würde bereits ein klei- 
ner Peak als „cut-off" genutzt werden. Wenn die erste Ableitung einer Verteilung kein Maxi- 
mum größer als der angenommene Wert von „minimal peak high" hat, wird immer das Tag 
mit der größten Häufigkeit als stark verwandt angesehen und der Rest verworfen. So identi- 
fizieren sie Cluster von Tags, die sich so ähnlich wie möglich sind. 

* Quer}^ tag: health: 

— Shopping, re search 

— nutrition, food, diet 

— fitness. workout, running 

— article, science 

— hfe, Ufehack. product,howtOj gtd^ reference. tip 

— esport, sport 

• Query tag: sports 

— hockey, nhl 

— basebal, mlb, triple 

— basketbal, nba, nbdl, wnba 

— footbaL nfi 

— alcohoL beer. tv. food. bar 

— Computer game, action game, free game 

Abbildung 7-7: Cluster für "health" und "sports", gewonnen nach der Methode von Begelman, Kel- 
ler und Smadja. 
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Begelman, Keller und Smadja beschreiben ihren Algorithmus als so schnell, dass es vor- 
stellbar wäre, die Cluster „on-the-fly", also während des Zugriff, zu generieren. 
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8 Fazit 

Die Forschung an Tagging und Folksonomy steht noch am Anfang. Doch die bereits pu- 
blizierten Arbeiten lassen darauf schließen, dass Tagging durchaus noch längere Zeit ein in- 
teressantes Thema bleiben wird. Tagging kann und sollte klassische Indexierungs verfahren 
und Klassifikationen weder ersetzen noch ablösen. Es ist als Komplement zu den bestehen- 
den Volltextsuchmaschinen auf der einen und strikt reglementierten Katalogen auf der ande- 
ren Seite zu sehen. 

Dass Collaborative Filtering funktioniert, zeigt nicht nur Amazon mit seinen Empfehlun- 
gen. Für Anwendungen auf Basis von Collaborative Filtering, stehen mit den durch Tagging 
erzeugten Folksonomies Datenbasen bereit, mit denen, besser als Buchkäufe das können, ge- 
nauer und zielgerichteter gefiltert werden kann. Das erläuterte Beispiel einer Collaborative 
Filtering- Anwendung für CiteULike ist ein Beispiel dafür. 

Mit dem Wissen über Clustering- Algorithmen und den Möglichkeiten der verschiedenen 
Graphendarstellungen von Folksonomies ist es kein weiter Weg mehr zu quasi-hierarchi- 
schen Folksonomy- Abbildungen. Diese Anwendungen müssen natürlich der Natur der 
Folksonomies, sich regelmäßig zu ändern, Rechnung tragen. Die Bildung von Clustern könn- 
te sich als Weg erweisen, dieses Problem zu lösen. 



9 Anhänge 
84 



9 Anhänge 



a Abbildungsverzeichnis 

Abbildung 1-1: Schematische Darstellung der hierarchischen Struktur von Bookmark-Sammlungen in 
Webbrowsern Die Ressource „URL x" ist in Ordner c2 abgelegt 9 

Abbildung 1-2: Ein einzelner Bookmark in del.icio.us, wie ihn ein Nutzer in seiner eigenen Book- 
marks- Sammlung sieht. Zu sehen ist der Titel der verlinkten Webseite, ein Zitat aus der Seite, die 
benutzten Tags, die Anzahl der übrigen Nutzer, die diese Webseite ebenfalls gebookmarkt haben 
sowie das Datum, an dem die Webseite gebookmarkt wurde 10 

Abbildung 1-3: In Bookmark- Verwaltungen wie del.icio.us, die auf Tags basieren, kann ein Bookmark 
zu mehreren Tags - "Ordnern" - gehören. Die Ressource „URL x" ist in den „Ordnern" Tag a, Tab b 
und Tag g abgelegt 10 

Abbildung 1-4: Ausschnitt aus dem Suchergebnis für "bowl" in der Sammlung des Powerhouse 
Museum. Oben die von Benutzern eingegeben Tags, die mit "bowl" in Beziehung stehen, unten die 
Klassen aus dem Thesaurus des Museums 13 

Abbildung 1-5: Suchergebnis von Qype für "bücher" in Darmstadt. Es zeigt neben den Treffern links 
auf der rechten Seite eine Karte mit den Standorten der Treffer. Außerdem werden zu "bücher" ver- 
wandte Tags angezeigt 14 

Abbildung 2-1: Erkannte Sprachen aus 3000 Tags von Flickrund del.icio.us 20 

Abbildung 2-2: Relativer Anteil verschiedener Trennzeichen bei zusammen gesetzten Wörtern 24 

Abbildung 2-3: Der Slash als 

Trennzeichen bei del.icio.us 24 

Abbildung 2-4: Mehrere Ebenen einer Pseudo-Baumstruktur mittels dem Slash als Trennzeichen 24 

Abbildung 2-5: Ablauf des Taggingprozess nach Sinah 27 

Abbildung 2-6: Einordnung der Taggingsysteme nach Hammond et al 33 

Abbildung 2-7: Darstellung des Modells einer "broad folksonomy" nach Vander Wal 34 

Abbildung 2-8: Darstellung des Modells einer "narrow folksonomy" nach Vander Wal 34 

Abbildung 2-9: Graph eines dreiseitiges Netzwerks nach Lambiotte und Ausloos, das den Ansatz von 
Taggingsystemen zeigt 39 

Abbildung 2-10: Tagging-Modell nach Marlow et al. Je eine "Tag-Gruppe" stellt eine Verbindung zwi- 
schen einer Ressource und einem Benutzer her. Darüberhinaus können sich durch Verlinkung inner- 
halb der Ressourcen (Hyperlinks) Verbindungen zwischen Ressourcen ergeben sowie durch Zugehö- 
rigkeit zu Organisationen Verbindungen zwischen Benutzern 42 

Abbildung 2-11: Eine Tag-Gruppe, bestehend aus den Tags tl, t2 und t3, verbindet eine Ressource und 
einen Benutzer 43 

Abbildung 2-12: Schnittmengen dreier Bibliotheken LI, L2 und L3. Die Schnittmenge Ul umfasst 
weniger Elemente als U2. Damit sind die Elemente aus L3 \ LI interessanter für mich als die L2 \ LI. 
43 

Abbildung 2-13: Darstellung des Ablaufs zur Identifikation interessanter und unbekannter Ressourcen. 



9 Anhänge 

85 

47 

Abbildung 3-1: Verteilung der Tags für eine zufällig ausgewählte Ressource 50 

Abbildung 3-2: Häufigkeitsverteilung der Tags eines Nutzers von del.icio.us 51 

Abbildung 3-3: Häufigkeitsverteilung der Tags eines Nutzers von del.icio.us 52 

Abbildung 3-4: Screenshot der Tag Cloud von del.icio.us vom 1 1.05.2006 53 

Abbildung 3-5: Flickrs Tag Cloud. Screenshot vom 11.05.2006 53 

Abbildung 3-6: Navigation auf http://ww.mcdonalds.de/ - Dargestellt als Tag Cloud 53 

Abbildung 3-7: Navigation auf http://tech.yahoo.com/ - Dargestellt als Tag Cloud 54 

Abbildung 3-8: Darstellung der persönlichen Tags mit Delicious Soup 55 

Abbildung 3-9: Screenshot von Delicious Soup. Er zeigt die Visualisierung der Beziehungen des Tags 
"api" 56 



Abbildung 3-10: Visualiserung der Beziehungen des Tags "cool" mit Ravelicous SpaceNav 57 

Abbildung 3-11: Visualierung der Beziehungen eines Tags mit TagClouds 58 

Abbildung 3-12: Die gezoomte Darstellung einer Folksonomy mit TagClouds stellt den Text viel zu 
klein dar und macht ihn so unleserlich 59 

Abbildung 3-13: Grouper bietet die Möglichkeit, Tags nach Gruppen zu ordnen. Wie TagClouds ist es 
mit größeren Folksonomies überfordert, was den Raum der Anzeige (Viewport) angeht 60 

Abbildung 3-14: Visualisierung der Beziehungen der Tags "tagging" und "folksonomy" mit Touch- 
graph 61 

Abbildung 3-15: Visuahsierung der Beziehungen rund um "socialsoftware" 61 

Abbildung 5-1: Ausschnitt aus dem Tagging-Formular von del.icio.us 67 

Abbildung 5-2: Type-Ahead-Funktion bei del.icio.us 68 

Abbildung 5-3: Ansicht der eigenen Linksammlung in del.icio.us 69 

Abbildung 5-4: Optionen zur Darstellung der eigenen Tags 69 

Abbildung 5-5: Darstellung der eigenen Tags als Tag Cloud. Angezeigt werden nur Tags, die mindes- 
tens fünf Mal benutzt wurden 69 

Abbildung 5-6: Ausschnitt aus der Ansicht der eigenen mit "discussion" getaggten Ressourcen 70 

Abbildung 5-7: Ansicht der mit "discussion" und "collaboration" getaggten eigenen Ressourcen 70 

Abbildung 5-8: Ausschnitt aus der Liste aller mit "discussion" und "collaboration" getaggten Ressour- 
cen 71 

Abbildung 5-9: Ausschnitt aus dem Tagging-Formular mit den Tags, die von einem anderen Nutzer für 
diese Ressource vergeben wurden 71 

Abbildung 5-10: Die Benutzeroberfläche zum Anlegen und Editieren von Abonnements 72 

Abbildung 5-11: Darstellung der Abonnements in der "inbox". Abonnements mit dem gleichen "inbox 
name" werden in einerm "Ordner" zusammengefasst 72 

Abbildung 5-12: Ausschnitt aus der Darstellung des "network" eines Nutzers 73 



9 Anhänge 
86 

Abbildung 5-13: Ansicht des RSS-Feeds einer "inbox" im Browser Firefox 73 

Abbildung 6-1 : Screenshot eines Artikel von heise.de. Neben dem eigentlichen Inhalt in der Mitte 
indexieren Volltextsuchmaschinen auch die Inhalte rechts und links davon 74 

Abbildung 6-2: Google findet für die angegebenen Suchbegriffe, die aus der Navigation von heise.de 
stammen, über vier Millionen Treffer allein aufheise.de selbst 75 

Abbildung 7-1 : Eine mittels der Volltextsuche gefundene Ressource kann der Nutzer in seinem "Mein 
Web" ablegen und dazu Tags vergeben 77 

Abbildung 7-2: Ausgehend von einem selbst vergebenen Tag (hier "tags") gelangt der Nutzer zu einer 
Liste aller damit getaggten Ressourcen und hat die Möglichkeit, "tags" mit weiteren Tags zu kombi- 
nieren und damit die Ressourcen weiter zu filtern 78 

Abbildung 7-3: Durch Filterung nach weiteren Tags hat sich die Treffermenge auf 1 10 reduziert 78 

Abbildung 7-4: Ausschnitt aus einer Tag-Hierarchie, erstellt nach der Methode von Heymann und Gar- 
cia-Molina 81 

Abbildung 7-5: Die beiden Graphen, die Heymann und Garcia-Molina nutzen, um aus einer Folkso- 
nomy eine Hierarchie zu generieren. Rechts der ungewichtete Ähnlickeitsgraph, links die sich erge- 
bende Hierarchie 82 

Abbildung 7-6: "Co-Tags" von "rss" und die Häufigkeit, mit der diese Tags gemeinsam mit "rss" in 
einer Tag-Gruppe vorkommen 83 

Abbildung 7-7: Cluster für "health" und "sports", gewonnen nach der Methode von Begelman, Keller 
und Smadja 84 

b Tabellenverzeichnis 

Tabelle 1: Nutzung von Sonderzeichen zur Markierung bestimmter Tag-Typen 23 

Tabelle 2: Dimensionen des Designs von Taggingsystemen nach Marlow et al 32 

Tabelle 3: Einordnung von del.icio.us in die Dimensionen des Designs von Taggingsystemen nach 
Marlow et al 65 



c Literaturverzeichnis 

[Anderson2004] 

Anderson, Chris: The Long Tau. Wired Magazine, Vol. 12, Issue 10. Oktober 2004. 
http://www.wired.coni/wired/archive/12.10/tail_pr.html - Zugegriffen am 07.08.2006. 

[Begelman2006] 

Begelman, Grigory; Keller, Philipp & Smadja, Frank: Automated Tag Clustering: 
Improving search and exploration in the tag space. In the Proceedings of WWW 2006 
Collaborative Web. Tagging Workshop, Edinburgh, Scotland. 2006. 
http://www.rawsugar.coni/www2006/automatedTagClustering.pdf-Zugegriffenam 
08.08.2006. 

[Chun2006] 

Chun, Susan et al.: Steve. museum: An Ongoing Experiment in Social Tagging, 
Folksonomy, and Museums. Proceedings Muesums and the Web 2006: 
http://www.archimuse.coni/mw2006/papers/wyman/wyman.html - Zugegriffen am 
06.08.2006. 



9 Anhänge 
87 

[Cialdini2001] 

Cialdini, R.: Influenece - Scienece and Practice. AUyn & Bacon. 4. Auflage, 2001. 
Zitiert nach [Golder2005]. 

[Dicl983] 

Dictionary ofContemporary English. Langenscheid-Longman, 4. Auflage, 1983. 

[Fugmannl999] 

Fugmann, Robert: Inhaltserschließung durch Indexieren: Prinzipien und Praxis. 
Deutsche Gesellschaft für Dokumentation e. V., Frankfiirt am Main. 1999. 

[Golder2005] 

Golder, Scott & Huberman, Bernado A.: The Structure ofCollaborative Tagging Systems. 
lnft)rmation Dynamics Lab, HP Labs. 18.08.2005: 
http://arxiv.org/abs/cs.DL/0508082. Zugegriffen am 03.06.2006 

[Guy2006] 

Guy, Marieke & Tonkin, Emma: Folksonomies: Tidying up Tags?. D-Lib Magazine, Vol. 

12, Issue 1. Januar 2006: 

http://www.dlib.org/dlib/january06/guy/01guy.html - Zugegrifi^en am 25.06.2006. 

[Hammond2006] 

Hammond, Tony et al.: Social Bookmarking Tools (I). D-Lib Magazine, Vol. 11, Issue 4. 

April 2005: 

http://www.dlib.org/dlib/april05/hammond/04hammond.html - Zugegrifl^en am 

05.07.2006. 

[Heymann2006] 

Heymann, Paul & Garcia-Molina, Hector: Collaborative Creation ofCommunal 
Hierarchical Taxonomies in Social Tagging Systems. Department of Computer Science, 
Stanford University, Stanford, CA, USA, April 2006. 
http://dbpubs.stanford.edu:8090/pub/2006-10 - Zugegriffen am 10.08.2006. 

[Kress2003] 

Kress, Günther: Literacy in the new media age. Routledge, 2003. Zitiert nach 
[Mejas2005]. 

[Lambiotte2005] 

Lambiotte, R. & Ausloos, M.: Collaborative tagging as a tripartite network. 
SUPRATECS, Unversite de Liege, Liege, Belgium. 09.07.2005. 
http://arxiv.org/abs/cs.DS/0512090 - Zugegriffen am 10.07.2006. 

[Marlow2006] 

Mario w, Cameron et al.: Position Paper, Tagging, Taxonomy, Flickr, Article, ToRead. In 
the Proceedings of WWW 2006 Collaborative Web. Tagging Workshop, Edinburgh, 
Scotland. 2006. 
http://www.rawsugar.com/www2006/29.pdf- Zugegriffen am 15.05.2006. 

[Mejias2005] 

Mejias, Ulises Ali: Tag Literacy. 26.04.2005. 
http://ideant.typepad.com/ideant/2005/04/tag_literacy.html - Zugegriffen am 20.07.2006. 

[Melzer2005] 

Melzer, James: The best ofdel.icio.us. 16.11.2005 

http://www.jamesmelzer.com/bearings/archives/2005/ll/the_best_of_del.html- 
Zugegriffen am 08.08.2006. 



9 Anhänge 
88 

[Melzer2006] 

Melzer, James: Making social bookmarking better. 19.02.2006. 
http://www.jamesmelzer.com/bearings/archives/2006/02/making_social_bookmark.^^ 
- Zugegriffen am 08.08.2006. 

[Mika2005] 

Mika, Peter: Ontologies are us: A unified model of social networks and semantics. In 
Proceedings of the 4^^ International Semantic Web Conference, 2005. 
http://www.cs.vu.nl/-pmika/research/papers/ISWC-folksonomy.pdf - Zugegriffen am 
08.08.2006. 

[Norton2006] 

Norton, Quinn: Iwant to build someting that grows\ Guardian Unlimited | Technology, 

26.01.2006: 

http://technology.guardian.co.Uk/weekly/story/0,, 1694487,00.html - Zugegriffen am 

19.07.2006. 

[Sinah2005] 

Sinah, Rashmi: A cognitive analysis of tagging. 27.09.2005: 

http://www.rashmisinha.com/archives/05_09/tagging-cognitive.html - Zugegriffen am 
16.07.2006. 

[Torres2005] 

Torres, Elias: Why I don Y like to infer semantics from tags. 21.07.2006. 
http://torrez.us/archives/2006/07/21/473/ - Zugegriffen am 09.08.2006. 

[VanderWal2005] 

Vander Wal, Thomas: Explaining and Showing Broad and Narrow Folksonomies. 21. 

Februar 2005: 

http://www. vanderwal.net/random/entrysel.php ?blog=l 635 - Zugegriffen am 06.07.2006. 



